Problème
Une campagne politique locale aux USA au niveau du comté avait besoin de ciblage au niveau du précinct — où faire du porte-à-porte, où dépenser en publicité locale, sur quels segments d'électeurs se concentrer. La campagne avait les données du voter file, des snapshots démographiques et l'historique de participation, mais personne pour les transformer en décisions opérationnelles.
Approche
Modèles de propensity et de participation construits au niveau du précinct utilisant les données du voter file combinées avec signaux démographiques publics et historique de participation. Identifié quels précincts avaient des électeurs persuadables à haut rendement vs. cibles de participation à haut rendement vs. faible rendement (skip). Sortie comme liste priorisée de porte-à-porte et de dépense publicitaire pour l'équipe terrain, avec rafraîchissements hebdomadaires durant le cycle de campagne.
Stack
Python · scikit-learn · Pandas / NumPy · geospatial joins · voter-file ETL
Résultat
L'équipe terrain a arrêté d'allouer l'effort uniformément à travers le comté et a commencé à se concentrer sur les précincts où le modèle disait que l'effort marginal changerait effectivement le résultat. La plus grande découverte était négative : une part significative des précincts où la campagne avait dépensé du porte-à-porte avait des populations persuadables infimes — ces heures ont été réallouées vers des zones à plus haut rendement.