Étape 9: Développement d’algorithme (partie 2): régression logistique appliquant
Comme je l’ai déjà mentionné, ML (Machine learning) est une sorte de chose de reconnaissance de modèle. Il sépare de 2 ou plusieurs groupes selon leurs caractéristiques. Par exemple si j’ai des tas de numéros de paires {(1,4),(6,3),(5,2)... (X, Y)}, je tiens pour les séparer en deux groupes, une paire contenant qui compte nombre de somme moins puis 6 et autre groupe contiennent le reste. Une ligne simple avec l’équation X + Y < 6 va faire notre travail.
Dans notre cas, X et Y seront fréquence dominante et moyenne des valeurs absolues maximales. Dans le script de visualiser, ce que j’ai joint à l’étape précédente, en plus juste visualisation des données, il aide dans le calcul de ces deux paramètres aussi.
Fréquence dominante est calculée à l’aide d’algorithme de FFT. (https://en.wikipedia.org/wiki/Fast_Fourier_transfo...)
Sur l’exécution du script de visualiser, vous obtiendrez des résultats pour fréquence dominante et les valeurs de crête absolue moyenne. Copier et coller dans un fichier texte, dans le format suivant.
Dominant_frequency_1, average_absolute_peak_values_1, 0/1...
0/1 à la place après la deuxième virgule indique à la méthode de régression logistique si les caractéristiques sont de quelques données ou données en cours d’exécution. 1 pour la marche et 0 pour la course.
s’il vous plaît, regardez l’exemple de fichier que j’ai joint pour une mise en forme appropriée.
Quelle régression logistique fait, c’est qu’il essaie de séparer cette marche et de course des données à l’aide d’une ligne droite. Montré dans l’Image. Comment sait-il que cette ligne se sépare ces deux ensembles de données?. Saute ici dans le mathématiques. C’est un peu difficile à expliquer par écrit, mais je vous joins un didacticiel vidéo relatif à la régression logistique par Andrew Ng, qui est un expert dans ce domaine.
À l’étape suivante, je vais parler de scripts, que vous pouvez utiliser sur vos propres données, pour obtenir l’algorithme qui n’est rien d’autre qu’une ligne droite qui sépare ces 2 ensembles de données.