Étape 4: Utilisent de pré traitement des données pour l’arbre de décision
Contrairement aux algorithmes HMM et DTW, arbre de décision n’est pas disposé à traiter du problème de classement dans les séries chronologiques. Une serie de temps est une séquence de données mesurées. Chaque geste a sa propre série chronologiques. Chaque serie de temps peut avoir un nombre différent des mesures, même étant les données d’un même geste. Pour utiliser Weka arbre de décision en l’espèce, nous devons extraire certaines caractéristiques de la serie de temps et de générer un fichier avec. ArFF extension.
Waleed Kadous a étudié dans sa thèse de doctorat et proposés deux approches pour extraire les caractéristiques d’une serie de temps. J’ai utilisé une approche qui, selon lui, a fonctionné étonnamment bien même en étant un algorithme simple. Cette approche consiste à diviser chaque série chronologique (quelle que soit la durée) dans un certain nombre de fenêtres. Ainsi, si longs, que la première fenêtre a les valeurs de la première à la neuvième mesure 45 échantillons en est un exemple, la deuxième fenêtre aura les valeurs de la mesure de la dixième à la dix-huitième et ainsi de suite. Ensuite, nous calculons statistiques pour chacune des fenêtres.
Une application de R a été développée, basé sur le fichier texte généré par l’application de traitement, pré traiter les séries temporelles et générer la partie données du fichier Weka train SLIA. Cette application calcule la moyenne et l’écart-type de chaque fenêtre de chaque axe (x, y et z) comme les caractéristiques.
BuildWekaFile.R