L’étude des sentiments à travers l’analyse des emojis 🧐 : l’exemple de la vaccination contre la covid19

Avec l’explosion de l’usage des smartphones et d’internet, l’utilisation des emojis dans les messages s’est développée. Selon un rapport de 2015 de l’équipe de recherche de Emogi, les emojis étaient utilisés par 92% de la population en ligne. Cette entreprise estimait même que plus de 2,3 trillions de messages contenant au moins un emoji allaient être envoyés en 2016. Ces petites images intégrées dans un message électronique ne représentent donc pas de la data négligeable.

L’analyse approfondie de ces emojis permet d’effectuer de “l’opinion mining” (ou “sentiment analysis”), c’est-à-dire une analyse des sentiments à partir de sources textuelles dématérialisées sur de grandes quantités de données. 

C’est ce que nous avons fait sur le sujet de la vaccination contre la covid19.

Extraction de la donnée pertinente sur twitter

extration données twitter

Pour cette analyse, nous nous sommes concentrés sur la communauté twitter. Afin de sélectionner les tweets en lien avec cette thématique, nous avons effectué des requêtes sur les termes suivants : 

  • “vaccins”
  • “vaccination”
  • “Pfizer”
  • “Astrazeneca”

Ces requêtes étaient volontairement larges pour avoir une vision globale et internationale des discours sur twitter. 

Ainsi grâce à notre outil d’extraction (codé en python), nous avons pu extraire l’ensemble des tweets contenant au moins un de ces termes sur la période du 25 au 26 mars. Ce qui nous donne un corpus de plus de 50 000 tweets.

Filtrage des emojis

Ceux-ci sont porteurs de sens lorsqu’ils sont mis dans un contexte, c’est la raison pour laquelle ils sont particulièrement intéressants pour faire de l’analyse de sentiment.

Une fois l’extraction et le nettoyage terminés, il s’agit de se concentrer seulement sur les emojis. 

Une étude de l’AMU (université de Aix-Marseille) propose des exemples d’utilisation des emojis :

  • ajouter une émotion à une phrase neutre
  • renforcer un sentiment dans une phrase déjà émotive 
  • modifier l’émotion d’un texte, par exemple en faisant clairement apparaître de l’ironie, du sarcasme etc…
  • donner des informations minimales plus rapidement que par écrit 
  • pour le “fun” car l’expéditeur trouve cela amusant et pense que ça le sera aussi pour le destinataire.
emojis

L’analyse des emojis présente cependant certains biais, notamment celui de la subjectivité de la personne qui interprète le sens. Dans notre cas, c’est le consultant data qui doit se défaire de ce biais, c’est la raison pour laquelle il est nécessaire de connaître les liens entre les emojis pour croiser les informations

La transformation en graphe

Le meilleur moyen d’avoir une vue globale est de mettre toute cette data sous forme de graphe, c’est-à-dire des nœuds et des liens. Si vous souhaitez en apprendre plus sur cette représentation vous pouvez lire notre article dédié à ce sujet.

Pour le créer nous utilisons un programme python avec deux règles :

  • lorsqu’un nouvel emoji apparaît un nœud se crée. Si l’emoji est déjà présent, une valeur s’ajoute au comptage du noeud existant
  • lorsque plusieurs emojis sont présents dans le même tweet, un lien se crée entre eux

Une fois construit, nous utilisons un logiciel de traitement spécialisé pour les graphes, afin de spatialiser l’ensemble et d’utiliser un algorithme de détection de communauté. 

Dans notre cas, nous finissons par obtenir ce résultat.

analyse de sentiment vaccin covid19 à travers les emojis

Contextualisation et analyse des sentiments

Pour bien comprendre le sens d’un emoji, il est primordial de le remettre dans son contexte : le contexte de l’application, le contexte conversationnel, le contexte social, etc…

Un exemple parfait est l’utilisation de cet emoji :

  • dans le monde occidental il est compris comme un signe faisant référence à la culture italienne
  • en Inde il sert à demander si quelqu’un a faim 
  • dans le monde arabe il sert à appeler au calme

Maintenant, en ayant bien compris cette nécessité de contextualiser, rentrons dans le détail.

emojis sentiments vaccins covid19

Après avoir à nouveau utilisé notre outil de détection des communautés sur le haut du graphe, nous apercevons 3 sous-discours :

  • l’enthousiasme (vert)
  • le scepticisme (bleu)
  • la colère/peur (rouge)

Il est intéressant de noter que le sous-discours de la colère/peur est deux fois moins important que les deux autres. Le sous-discours enthousiaste est composé d’emojis tels que 🥂 ou 💃, qui semblent évoquer l’idée/la possibilité d’une reprise d’une vie “normale”.

Dans la communauté regroupant les drapeaux, nous observons deux communautés importantes, et deux plus petites.

Pour aller plus loin, il conviendrait de segmenter l’analyse par pays.

emojis vaccins pays covid19

Besoin de connaitre ce que pensent les internautes, les clients, les consommateurs de votre entreprise, d’un produit ou autres ?