L’analyse de sentiments (mauvaise traduction de Sentiment Analysis) est un sujet qui s’est fortement développé avec l’analyse de la eReputation. En fait de sentiment, il s’agit plutôt de mesurer une tonalité et de savoir si un document (article, post, commentaire, ..) est favorable, défavorable ou neutre, la terminologie positif, négatif, neutre étant plus couramment adoptée.
La difficulté est bien connue : comment savoir si un document est positif sachant que dans cette affirmation il y a nécessairement une forme de jugement donc de subjectivité et que l’expression spontanée des internautes est un langage, parfois très fleuri, où la métaphore est reine ! La plupart des logiciels de eRéputation se contentent de dénombrer des mots ou expressions pré-supposés positifs, négatifs ou neutres ; les limites de cette approche sont vite atteintes.
Plutôt que de juger un document par cette dichotomie discutable, nous avons cherché à qualifier les sentiments tels qu’ils y sont exprimés, étant entendu que dans un contexte métier, cette démarche répond à des objectifs précis. Démarche ambitieuse car le résultat n’aura rien à voir avec un comptage de « plus » et de « moins » mais permettra à un analyste d’avoir une réponse approfondie aux questions qu’ils se posent. Cette ambition, nous avons souhaité vous la présenter à travers plusieurs posts expliquant à la fois la technologie et son usage.
Etape 1 : que mesure-t’on ?
Qwam Text Analytics qualifie un sentiment à partir de trois critères : Thématique, Nature, Force. La Thématique c’est bien évidemment le sujet étudié qui correspond à l’objectif de l’analyste. La Nature précise le type de sentiment : colère, joie, inquiétude… La Force est assez explicite : ce sentiment, par exemple de la colère, s’exprime-t’il avec virulence ou modération ?
Prenons l’exemple d’une entreprise qui réalise un sondage auprès de ses collaborateurs sur leurs conditions de travail, leurs difficultés et leurs satisfactions. Sondage réalisé via des questions ouvertes permettant des réponses libres. L’analyste en charge de ce travail va distinguer plusieurs Thématiques comme par exemple les conditions de travail, les horaires, les espaces et lieux de détente, les rapports avec la hiérarchie…. Et pour chacune de ces Thématiques, la Nature des sentiments exprimés : colère, satisfaction, etc.
Nous verrons ci-après que si cette Nature est assez invariante, la façon de la verbaliser dépend évidemment de la thématique : un collaborateur exprimera son insatisfaction (Nature) sur la qualité du restaurant d’entreprise (« la nourriture est insipide ») par des mots différents que ceux employés pour parler de son manager (« il est sourd et on ne peut jamais lui parler »).
La Force dépendra bien évidemment de la virulence du propos : le « ce n’est plus tolérable » correspond à un sentiment de Force plus élevée que « nous souhaiterions une amélioration ». Notons que dans le paragraphe précédent (restaurant vs manager) la Force est équivalente.
Qwam Text Analytics distingue 7 niveaux de force, allant de – 3 à +3. Les valeurs positives expriment une force élevée alors que les négatives au contraire la modération, le 0 exprimant une norme pour le corpus étudié. Dans l’exemple du sondage d’entreprise, l’expression « pas terrible » à propos de la cafétéria sera considérée comme neutre (0), la restauration collective étant rarement considérée comme gastronomique. La même expression s’agissant du service client de l’entreprise sera évidemment plus préoccupante et aura une Force de +1 voire +2.
Il est assez évident qu’une analyse basée sur les triplets « Thématique, Nature et Force » sera infiniment plus précise et utile qu’un simple tri, positif, négatif ou neutre. Ainsi, en reprenant l’exemple du sondage d’entreprises, un analyste pourra affirmer avec précision, en analysant des questions ouvertes et non des QCM:
– 80% des collaborateurs sont mécontents de leur rapport avec leur hiérarchie et l’expriment avec une force élevée (+2).
– 15% sont satisfaits des rapports avec leur hiérarchie mais l’expriment modérément (force -1).
– 20% sont très mécontents de leurs conditions de travail et l’expriment avec virulence (force +3).
– 50% sont mécontents des conditions d’accès au site mais l’expriment avec modération (-1).
Qwam Text Analytics apporte donc une réponse de très haut niveau à l’analyse de sentiments. A cette étape, notamment s’il est linguiste, le lecteur s’interroge sur l’automaticité et la performance de cette technologie. Nous serons ravis de lui expliquer dans quelques jours avec un nouveau post « Analyse de sentiments – Etape 2 : comment ça marche » !