Étape 2: Ensembles de données propre
Il s’agissait d’un processus itératif et finalement je l’ai trié mais non sans beaucoup d’heures et de maux de tête.
Le principal problème avec les données est que :
(1) il n’était pas tout à fait propre, ce qui signifie que les données de conduite n’a pas correspondre avec tous les nœuds. Il y avait quelques chaînes d’id qui existaient en double, disparus et plus encore. Surtout, il était beau, mais elle avait besoin de soins de l’algorithmique.
(2) quand j’ai assemblé les nœuds, il y avait beaucoup de petits et isolés de sous-réseaux au lieu d’un gigantesque réseau de données. J’ai commencé avec des points de données environ 30 000, et le réseau « primaire » était environ 28 000 points. J’ai fini par avoir toutes sortes de mini-réseaux de données : allant de 2 à 100 en taille. Comme un objet 3d-imprimés, ceux-ci doivent être un objet unique et cohérent, dans le cas contraire, l’impression 3D va s’écrouler.
Mon code analyseur fait de son mieux de nettoyer les données et d’ignorer ce que je n’avez pas besoin.
J’ai écrit le code en Java, ce qui n’est pas le plus efficace moteur : il est lent et lourd code, mais c’est une langue que je connais bien il y a beaucoup de bibliothèques JSON commode pour elle comme la bibliothèque de gson.
Les librairies de json dans OpenFrameworks — la boîte à outils open source C++ — aurait été rapide, mais nécessite beaucoup d’extra compilation. Aussi une fois qu’ils courent, ils ne finissent par me donner les possibilités de personnalisation que j’ai dans les exportations de champ de données de Javas.
Python propose de bons outils de l’analyse, mais pas une interface assez décente. JavaScript est probablement la meilleure solution, mais je ne sais pas assez bien (encore) de l’environnement.