Étape 2: Votre premier coup de racloir : saisir les noms d’utilisateur sur un thread de Reddit
https://www.Reddit.com/r/Arduino/comments/3rixq5/i...
La première étape dans la construction d’un grattoir va toujours être
identifier ce que nos informations de clé sont étiquetées sous. Dans ce cas, nous voulons que tous les noms d’utilisateurs dans les commentaires d’un thread de reddit. Donc nous allons utiliser google chrome inspecter pour savoir ce que le nom d’utilisateur est étiqueté comme outil d’élément. (image 1)
Cela devrait apparaître le terminal suivant avec le nom d’utilisateur qui a mis en évidence: (2)
Nous voyons que tous les noms d’utilisateur dans un thread de reddit correspondent aux liens avec la classe « auteur ». Maintenant, voici la partie la plus délicate : nous avons besoin d’un moyen de trier tous les éléments de page web différente pour passer à la balise avec la classe « auteur ». Comme vous pouvez le voir il n’est pas un voyage facile, parce que ces liens se trouvent le :
< div class = « commentarea » >
qui puis plonge vers le bas
< div id = « siteTable_t3_3rixq5 » class = « sitetable nestedlisting » >
qui plonge encore plus d’éléments html. Afin de minimiser les
montant de javascript, que nous avons à écrire, nous allons externaliser l’analyse réelle de notre page web de Yahoo YQL langage. Cela va parcourir tous les éléments html différent et nous renvoyer ces balises précieuses que nous désirons. Ne vous inquiétez pas si vous êtes confus dès maintenant ; la prochaine étape va rendre les choses plus claires.