Ce que l’on apprend des candidats quand on analyse comment ils s’expriment sur Twitter

Sur Twitter, les prises de parole des candidats sont relayées quasiment en direct, rendant compte des prises de positions dans les matinales, les meetings, les forums, les conférences de presse, etc.

Sur le site Idéo2017 je propose, en collaboration avec l’équipe du projet #Idéo2017, des articles qui analysent les débats et événements depuis les primaires de droite. Le 29 mars, la plateforme Idéo2017 a été mise en ligne: elle permet aux citoyens, à partir du portail suivant, de mener des recherches dans le corpus des tweets des candidats (recensés depuis le 1er sept 2016, et mis à jour quotidiennement).

JULIEN LONGHI

Sur la partie gauche, l’utilisateur peut chercher à comparer l’usage de certains termes les plus emblématiques des discours politiques par les candidats; au milieu, il peut analyser des corpus (soit celui de l’ensemble des candidats, soit celui d’un candidat en particulier); sur la partie de droite, il peut accéder à une interface intuitive et dynamique qui permet de faire des recherches dans les tweets et de pouvoir accéder aux liens des tweets dans leur environnement.

Lire la suite sur le Huffington Pot

#Idéo2017, l’observatoire linguistique des candidats à la présidentielle

Une dynamique engagée depuis 2012

Article publié sur Linkedin

Loin de répondre à un effet de mode, #Idéo2017 est la concrétisation d’un travail de longue haleine entrepris depuis 2012, lors d’une collaboration avec le Huffington Postpour une série de billets « Dis-moi ce que tu tweetes« .

En 2013, je publiais mon premier article scientifique sur le sujet des tweets politiques, permettant une caractérisation du tweet politique comme genre du discours politique : « Essai de caractérisation du tweet politique », dans la revue L’Information grammaticale. La prise en compte du tweet politique comme un genre du discours politique (écouter cette chronique de France Culture) justifiait une analyse rigoureuse de cette forme d’expression. Une collaboration avec des chercheurs en informatique (Claudia Marinica, Boris Borzic et Abdulhafiz Alkhouli) donnait alors une envergure supplémentaire à cette recherche, et débouchait sur la constitution du premier corpus de tweets au plan national, hébergé par l’équipex OrtolangPolititweets, corpus de tweets provenant de comptes politiques influents.

Ortolang est un équipement d’excellence validé dans le cadre des investissements d’avenir. Son but est de proposer une infrastructure en réseau offrant un réservoir de données (corpus, lexiques, dictionnaires, etc.) et d’outils sur la langue et son traitement clairement disponibles et documentés. Cette mise en ligne était donc à la fois un gage de crédit scientifique et académique, et un encouragement à poursuivre le travail engagé.

Sur la base de ce corpus, plusieurs travaux scientifiques ont été menés sur les tweets politiques, et présentés dans différents congrès, nationaux ou internationaux: en Allemagne sur l’idéologie, en Angleterre sur les aspects techniques des corpus de tweets, à Paris sur l’hybridation des discours institutionnels sur Twitter, etc.

Le projet #Idéo2017 se situe dans la continuité de tout ce travail : il vise à tirer profit de ces résultats (connaissances techniques, scientifiques, et usage de datavisualisations) pour mettre un outil à la disposition des citoyens.

Une plateforme destinée au plus grand nombre

Prenons un exemple: en entrant sur la plateforme #Idéo2017, l’utilisateur peut choisir plusieurs types d’analyses.

 

Sur la partie gauche, il peut chercher à comparer l’usage de certains termes les plus emblématiques des discours politiques par les candidats (liste établie sur la base des recherches de Cécile Alduy). Au milieu, il peut analyser des corpus, soit celui de l’ensemble des candidats, soit celui d’un candidat en particulier. Sur la partie de droite, il peut accéder à une interface intuitive et dynamique qui permet de faire des recherches dans les tweets et de pouvoir accéder aux liens des tweets dans l’environnement Twitter.

Si l’utilisateur choisit de s’intéresser au mot « islam » par exemple, plusieurs analyses sont proposées:

 

Les analyses sont réalisées à l’aide de plusieurs langages et outils, notamment ElasticSearch pour stocker les tweets, les scripts Iramuteq pour certaines analyses, distribués sous les termes de la licence GNU GPL (v2) et ElasticUI pour le développement du moteur de recherche.

Ainsi, l’utilisateur peut comparer le sur-emploi ou sous-emploi de ce mot par les différents candidats:

 

Supposons maintenant que l’utilisateur soit surpris du sous-emploi de Islam par Marine Le Pen, et l’emploi relativement modeste par François Fillon. Il peut chercher l’emploi de ce mot et de ses dérivés, et observer leur fréquence:

 

Il verra ainsi que le nombre de tweets dans lesquels se trouve cette forme est très important chez ces deux candidats.

Ceci se confirme d’ailleurs en regardant les relations de ce mot avec d’autres mots, proposées sous forme graphique:

Islam est en effet très lié à différents réseaux ou noeuds:

  • islamisme/immigration/communautarisme,
  • islamiste/fondamentaliste/idéologie/attentat/terrorisme,
  • islamique/totalitarisme/Syrie

Devant ces résultats, un retour au corpus s’impose, et il est rendu possible grâce à la partie « navigation »:

 

Grâce au moteur de recherche, l’utilisateur peut taper le terme qui l’intéresse, et les propositions de tweets s’affichent dynamiquement:

 

Il suffit alors de cliquer sur la vignette de son choix, et le texte du tweet apparaît:

 

Ceci confirme le résultat graphique obtenu dans les premières requêtes, puisqu’il est question, dans le tweet de Marine Le Pen, de « terrorisme islamiste ».

Le lien permet ensuite d’aller directement au tweet dans l’interface de twitter:

 

L’utilisateur peut ainsi se forger son opinion sur tel ou tel candidat grâce à ce processus itératif proposé dans #Idéo2017: analyses globales lexicales ou par corpus, résultats et hypothèses, réponses, nouvelles questions, « enquêtes », etc. Tout est réuni pour que chacun puisse appréhender le discours des candidats avec objectivation et rigueur. De nombreuses études ont été publiées sur le blog du projet, en amont du développement technique, et seront enrichies de nouvelles analyses 100% #Idéo2017.

« Peuple », « projet »… Sur Twitter, les candidats ne choisissent pas les mots au hasard

"Peuple", "projet"... Sur Twitter, les candidats ne choisissent pas les mots au hasard"François Fillon est lui même assez souvent sur Twitter. Il regarde ce qui se dit. C’est quelque chose auquel il attache de l’importance", explique à L'Obs Gautier Guignard, qui dirige sa campagne digitale. Photo d'illustration datant de 2015. (JEAN-FRANCOIS MONIER / AFP)

Plusieurs outils permettent de décortiquer le vocabulaire des prétendants à l’Elysée sur Twitter. Le résultat est à la fois fascinant et désolant. Explications.

Charlotte Cieslinski

L’ère des tracts distribués sur les marchés n’est pas révolue, celle de l’indéboulonnable JT du 20 heures non plus. Mais aujourd’hui, un tweet écrit par un candidat à l’élection présidentielle est tout aussi utile : il peut atteindre des centaines de milliers, voire des millions d’électeurs connectés. « C’est bien plus qu’une caisse de résonance », assure Gautier Guignard, responsable de la campagne digitale de François Fillon, selon qui « un tweet peut démultiplier par 10 ou 20 une audience de meeting ».

« Retweetés », commentés ou intégrés dans le corps même des articles des sites d’info, ces tweets sont devenus des objets politiques à part entière. Plusieurs outils, comme Ideo2017 ou encore Semiotweet lancé ce lundi 27 mars, permettent de décortiquer les paroles des prétendants à l’Elysée, leurs expressions fétiches, leurs mots clés. Et leurs enseignements sont édifiants : François Fillon « veut », alors que pour Jean-Luc Mélenchon « il faut ». Marine Le Pen met l’accent sur « la France qui doit », quand Benoît Hamon insiste sur « la gauche » qui « peut ».

Lire la suite sur L’Obs