Étape 4: Trouver les données
C’est le plaisir, la partie qui comprenait des heures de recherche sur internet au cours de quelques mois. Contrairement à l’utilisation des outils d’atelier, tout en faisant d’internet recherche vous pouvez boire du whisky ! Cela a aidé avec la corvée du tamisage par les ensembles de données.
J’ai parcouru par le biais de données sur GitHub repos, sites Web du gouvernement, par le biais de relations personnelles et bien plus encore. Certaines données « mauvaises » semblaient trop localisées (comme San Antonion Booze ventes), alors que d’autres semblent plus judicieux tels que les emplacements de toutes les Prisons américaines dans le monde.
Les séries de douze finales de données "mauvaises" J’ai choisi étaient) :
* Annonces Airbnb 2015 à San Francisco (source de données : darkanddifficult.com)
* Meth Labs à Albuquerque (source de données : http://www.metromapper.org)
* Des Prisons américaines (source de données : Initiative de politique pénitentiaire. prisonpolicy.org)
* U.S. fusillades de masse (1982-2012) (source de données : Mother Jones)
* Sur la liste noire IPs (source de données : Suricata SSL Blacklist)
* Les violations de données Internet (source de données : http://www.informationisbeautiful.net/)
* Dans le monde entier d’OVNIS (source de données : National UFO Reporting Center (NUFORC))
* Lieux hantés dans le monde entier (source de données : Wikipedia)
* Missouri avortement Alternatives (source de données : data.gov (gouvernement américain))
* 18 ans des expulsions de San Francisco (source de données : expulsion contre le projet de cartographie et de la Commission de location San Francisco)
* Southern California Starbucks (source de données : https://github.com/ali-ce)
* Denver dispensaires de Marijuana (source de données : le portail de données ouvertes Denver)