Primaire à droite : qui tweete le plus et sur quoi

Article initialement publié sur le Cercle des Echos

La campagne des primaires de droite bat son plein, à quelques heures du troisième débat, et quelques jours du premier tour. Les réseaux sociaux sont un bon moyen pour les candidats d’affirmer leur présence en ligne. J’ai mené une analyse ciblée des comptes Twitter des sept candidats, en prenant en compte les 200 derniers tweets postés le 10 novembre.

En constituant un corpus avec ces différents tweets (messages issus des comptes, retweets ou partages de liens), on peut mener un certain nombre d’analyses textométriques (qui permettent une mesure des textes par des calculs statistiques). L’analyse des similitudes suivante représente la fréquence des termes employés (par leur taille) et leurs relations (par les liens et la taille des liens) : on remarque que la fréquence d’apparition des candidats n’est pas représentative des sondages d’opinion, puisque Bruno Lemaire et Jean-François Copé, sont les plus cités.

graph_simi_1

Ce graphique est une analyse de similitude. Ici, la taille des mots est proportionnelle à leur fréquence. Leur positionnement fonction de leurs relations.

Les «impôts» pour Copé, la «France» pour NKM

Bien sûr, la mesure quantitative ne permet pas de faire des projections sur la qualité de la présence en ligne, ni sur l’efficacité obtenue. Néanmoins, si on procède à une analyse lexicale par la classification de l’ensemble des segments de textes, on peut définir six classes, comme le montre le dendrogramme ci-dessous.

dendrogramme_1

Dendrogramme qui permet de dégager les thèmes préférés des candidats à la primaire.

Ce qui est remarquable, c’est que ces classes sont associées de manière assez stable et claire à des candidats. De gauche à droite sur le schéma, Nicolas Sarkozy est associé à «policier», «tout pour la france», «président». Nathalie Kosciusko-Morizet est associée à «France», «donner» et «société». Jean-François Copé à «baisser», «économie», «social», «impôt». Bruno Le Maire à «renouveau» , «éducation», et aussi beaucoup d’éléments de communication («jeunes avec blm», «avec blm»). François Fillon avec «Trump», «meeting», et «Europe 1».

Seule la classe numéro 3 semble moins marquée par un candidat, puisqu’on retrouve Jean-Frédéric Poisson, et de manière plus surprenante Alain Juppé. Cette classe contient des termes étant soit liés à l’élection elle-même («primaire», «droite», «candidat»), soit au centre («centre», «Bayrou»).

Juppé, si discret

Statistiquement donc, Alain Juppé ne semble pas rattaché à un lexique spécifique, mais à un discours général (voire langue de bois ?) car ses affinités vont plutôt avec un vocabulaire assez général, ou lié à ses affinités avec le centre. Cette non-présence ressort sur la visualisation suivante.

Ici, une analyse factorielle des correspondances. Cette représentation visuelle permet des interprétations qui mettent en correspondance les parties de corpus ou les sous-ensembles avec les éléments qui composent ces parties.

Elle fait ressortir la présence des personnalités avec le lexique qui leur est statistiquement lié. On observe ainsi avec cette représentation que dans l’espace de gauche du graphique que François Fillon a une visibilité plus importante que Jean-Frédéric Poisson ou Alain Juppé (candidats que l’on peut qualifier de plus consensuels du point de vue de la personnalité, sans que cela ne soit corrélable à leurs programmes).

Julien Longhi