Le big data s’invite dans la campagne présidentielle

« Predict the President » : c’est le nom du projet, encore expérimental, que conduisent cette année cinq étudiants du Mastère Spécialisé® Big Data de Télécom ParisTech. Mohamed Al Ani, Davy Bensoussan, Alexandre Brehelin, Bertrand de Véricourt et Raphaël Vignes collaborent depuis le mois de novembre avec le magazine Le Point pour mettre en œuvre une nouvelle approche d’estimation de l’attractivité des candidats auprès des citoyens.

Le projet « fil rouge » est une composante importante de la formation en science des données délivrée à Télécom ParisTech. Il permet aux étudiants de travailler sur des données réelles, dans un contexte professionnel concret, en exploitant tous les acquis de la formation : fouille et traitement des données, état de l’art de la recherche en statistique, programmation des algorithmes de machine learning, visualisation des données… Ce projet « Predict the President » s’inscrit, de plus, complètement dans le credo de l’école : « Innover et entreprendre dans un monde numérique », puisqu’il s’applique à un sujet de société complètement d’actualité, à savoir la place de plus en plus grande des réseaux sociaux dans les campagnes électorales.

Voir l’article sur le site du Point

En quoi cette nouvelle méthode d’estimation est-elle innovante ? Dans quelle mesure vient-elle suppléer les multiples sondages qui rythment la campagne présidentielle ? Avec au moins 1 million de tweets récupérés par mois depuis février et 60 Go de données stockées et analysées, « Predict the President » s’appuie sur des informations bien différentes. L’outil se positionne comme complémentaire des instituts de sondages en analysant en premier lieu les éléments qui vont influencer l’électeur dans son choix. L’équipe du projet étudie ainsi les données socio-économiques disponibles en open data, comme la démographie, les précédents résultats des élections depuis 1981, le taux de chômage… à l’échelle de chaque département. Dans un second temps, ce socle est enrichi avec une agrégation des sondages, mais également des données issues de Twitter et des recherches effectuées sur Google par les internautes, qui sont, elles, très changeantes sur de courts laps de temps.

Les étudiants détaillent leur démarche sur leur blog

Nos cinq étudiants reconnaissent certaines limites dans leur méthode et rappellent l’aspect expérimental et novateur de leur projet. Ce dernier se poursuivra jusqu’au mois de juin, et les résultats des élections – quels qu’ils soient ! leur apporteront de précieux enseignements qui viendront à leur tour enrichir leur modèle et leurs algorithmes. De fait, que leurs prédictions se révèlent exactes ou non, l’analyse prédictive à partir de données numériques, appliquées aux études d’opinions, est une discipline en plein essor. L’attrait de nombreux médias pour ce projet en est une confirmation.

Voir l’intervention de Bertrand de Véricourt sur 01 Business Forum

L’équipe de « Predict the President »

Tous ont choisi le Mastère Spécialisé® Big Data pour se spécialiser ou se perfectionner dans les technologies et usages du big data.

Alexandre Brehelin, 25 ans, diplômé d’un magistère d’ingénieur économiste au sein de l’Aix-Marseille School of Economics (AMSE) et d’un master 2 d’ingénierie statistique et financière à l’Université Paris 2.

Raphaël Vignes, 26 ans, de formation ingénieur en informatique diplômé de l’ISEN Toulon, a travaillé 3 ans dans le domaine de l’informatique au sein d’une ESN française et a souhaité s’aguerrir dans le domaine de la data science et du big data.

Mohamed Al Ani, 24 ans, diplômé de l’école d’ingénieur INSA de Rouen en spécialité génie mathématique, a fait un an d’alternance à SAP en tant que Junior Data Scientist et souhaite continuer à gagner en technicité sur les domaines du big data.

Davy Bensoussan, 27 ans, après un parcours mathématiques appliquées à Dauphine et diplômé de l’ESCP Europe, a travaillé dans le conseil en stratégie avant de s’orienter vers le big data.

Bertrand de Véricourt, 29 ans, Diplômé de l’ISEP, a effectué un VIE en Allemagne avant de revenir en France pour travailler dans le conseil. Ayant eu une expérience en data journalisme au tout début de sa carrière, il s’est passionné pour la data science et a voulu monter un projet combinant big data et data visualisation à même d’être exploité par un média.