Où puis-je trouver des informations détaillées sur les votes qui ont été comptabilisés lors de l'élection de 2020?

Nov 20 2020

J'ai besoin d'un ensemble de données complet indiquant quand les votes individuels ont été exprimés et pour qui aux États-Unis lors des élections générales de 2020. Je peux trouver les totaux sur les sites Web des comtés et les totaux des candidats à la présidentielle par comté, mais ce dont j'ai besoin au minimum, c'est d'un ensemble de données qui comprend les délaisde toutes les mises à jour de chaque circonscription pendant le processus de dépouillement. Autrement dit, quel était le nombre réel de votes pour chaque candidat rapporté par chaque circonscription et quand ont-ils été rapportés? Je pense qu'il est probable que de nombreux sites journalistiques aient eu accès à cette information, mais je ne l'ai trouvée publiquement disponible nulle part. (Il devrait être rendu public.) Si possible, j'ai besoin d'un ensemble de données comprenant les identifiants des électeurs anonymes et le contenu complet du bulletin de vote (y compris les bulletins de vote rejetés et pourquoi ils ont été rejetés, par exemple, si une correspondance de signature a réussi ou échoué), et surtout, leur source (envoi postal, dépôt ou vote en personne). Les données horodatées seraient grandement préférées, y compris, si possible, l'heure de réception marquée et l'heure à laquelle chaque bulletin de vote a été tabulé.

La cerise sur le gâteau serait de trouver les décomptes électoraux historiques et les détails du scrutin (et si possible, des pièces d'identité corrélées) pour les élections passées à des fins de comparaison.

Quelqu'un connaît-il un ensemble de données publiques que je peux obtenir qui correspond à une partie substantielle de cette description?

Réponses

3 Fizz Nov 21 2020 at 10:42

Il n'y a probablement pas de base de données disponible gratuitement, bien que, comme vous l'avez noté, certaines organisations médiatiques aient rassemblé les mises à jour ... et par exemple 538 a produit des graphiques chronologiques comme ceux-ci basés sur ces ensembles de données.

Je ne sais pas si, par exemple, ABC et / ou Edison Research facturent l'accès à ces données. Votre meilleur pari est probablement de les contacter et de vous renseigner sur les conditions dans lesquelles ils mettront les données brutes à votre disposition.

En principe, toute personne intéressée et suffisamment déterminée aurait pu créer un tel ensemble de données puisque les mises à jour elles-mêmes étaient des informations publiques; c'est juste qu'ils ont été écrasés sur les sites Web des conseils d'état / de comté, etc. chaque fois qu'il y avait de nouvelles données. (J'ai vérifié quelques sites de ce type et ils n'ont que les chiffres définitifs maintenant.)


Un q différent ici a en fait fourni les données brutes que NYT a extraites d'Edison; il semble que les fichiers bruts sont toujours disponibles par état, par exemple

  • https://static01.nyt.com/elections-assets/2020/data/api/2020-11-03/race-page/pennsylvania/president.json

  • https://static01.nyt.com/elections-assets/2020/data/api/2020-11-03/race-page/michigan/president.json

Attention cependant à ne pas avoir de décompte absolu des votes sauf pour le total; pour chaque candidat, vous n'obtenez qu'une approximation (à trois chiffres) de leur part de vote:

{"vote_shares":{"trumpd":0.593,"bidenj":0.384},"votes":958809,"eevp":17,"eevp_source":"edison","timestamp":"2020-11-04T02:11:23Z"},
{"vote_shares":{"trumpd":0.593,"bidenj":0.383},"votes":959682,"eevp":17,"eevp_source":"edison","timestamp":"2020-11-04T02:13:39Z"}

(De manière amusante, cette approximation à trois chiffres est apparemment une bonne partie d' une théorie du complot .)

Une recherche supplémentaire trouve une page github qui a rassemblé tout ce NYT dans un results.jsonfichier géant pour tous les États!

Dans la direction opposée, les données d'état NYT sont en fait obtenues par eux en "concaténant" les données de circonscription (les fichiers json d'état les référencent) ... et ces fichiers json au niveau de la circonscription sont également toujours disponibles, par exemple

  • https://static01.nyt.com/elections-assets/2020/data/api/2020-11-03/precincts/PAGeneralConcatenator-latest.json

Ils contiennent des décomptes de votes réels pour les candidats (pas des approximations), mais ceux-ci semblent être des totaux et ne semblent pas avoir d'horodatage, par exemple

{"precinct_id":"Bethlehem 11th Ward 1st District","locality_name":"Lehigh","results":{"bidenj":410,"trumpd":218,"jorgensenj":10},"vote_type":"total","is_complete":null,"geo_id":"42077-BETHLEHEM 11","precinct_name":"","locality_fips":"42077","is_geographic":true,"votes":638,"is_reporting":true},
{"precinct_id":"Bethlehem 12th Ward 1st District","locality_name":"Lehigh","results":{"bidenj":439,"trumpd":169,"jorgensenj":12},"vote_type":"total","is_complete":null,"geo_id":"42077-BETHLEHEM 12-1","precinct_name":"","locality_fips":"42077","is_geographic":true,"votes":620,"is_reporting":true},

Une enquête plus approfondie indique qu'il existe probablement des fichiers séparés pour chacune de ces mises à jour, nommés avec l'horodatage exact de la mise à jour, par exemple

  • https://static01.nyt.com/elections-assets/2020/data/api/2020-11-03/precincts/PAGeneralConcatenator-2020-11-22T03:09:17.348Z.json

Mais le hic, c'est que le fichier d'état manque la dernière partie de l'horodatage (les points décimaux après les secondes) dans la liste de mise à jour qu'il contient, donc je ne sais pas comment obtenir tous les fichiers de mise à jour au niveau de la circonscription.