Bien que le titre invite à le penser, cette alternative ne correspond pas une coquetterie sémantique mais à l’une des thématiques abordées lors du salon All for Content. Plus précisément, lors de la conférence « Sémantique, analyse du sentiment, opinion mining… de nouvelles opportunités au service de la « connaissance-client », pour quels bénéfices ? » à laquelle QWAM a participé.

Introduite par Gaëlle Ressourcé, ce choix et surtout l’emploi de l’expression « Fouille d’opinions » ont le mérite de poser à nouveau le débat sur l’analyse du sentiment, expression consacrée mais qui ne veut pas dire grand-chose.

Tout dépend de l’objectif : soit, il s’agit de distinguer des « sentiments » positifs ou négatifs des internautes afin de construire de belles présentations pour dire qui est aimé ou ne l’est pas. Dans ce cas, nous sommes bien dans l’analyse de sentiments et franchement, l’intérêt de ce type de démarches, sauf cas particulier, est limité. Soit, l‘objectif est de comprendre et donc d’analyser les opinions des internautes, le terme de « fouille » (le mining anglais) est justifié.

Comme l’ont rappelé plusieurs des intervenants, fouiller les opinions des internautes, telles qu’ils les expriment librement et spontanément sur le Net, est une opération beaucoup plus complexe qu’un simple comptage de mots présupposés positifs ou négatifs (avec tous les biais que des verbatim ironiques ne manquent pas d’introduire).

Comme pour les opérations de text-mining, la première étape est la collecte des données, sachant que les lieux d’expressions sont variés avec des typologies bien distinctes (Twitter n’a pas grand-chose à voir avec un site d’avis de consommateurs). 70% du traitement global sera consacré à la collecte des données, qui est la « phase la plus importante ». Ask’n’Read de QWAM répond à cette problématique.

Le corpus ainsi constitué est prêt à être analysé. La solution QWAM Text Anaytics intègre deux moteurs: l’un, « d’annotation » qui permettra d’identifier des expressions ayant une valeur sémantique et l’autre, « de découverte » qui permettra par exemple, d’identifier des opinions qualifiées par le Thème (de quoi parle-t‘on ?), par la Nature (cette opinion exprime t’elle la colère, la frustration, le manque, la peur ou la satisfaction ?) et enfin par la Force, mesurée sur une échelle de -3 à +3.

Par exemple, dans le domaine des Relations humaines, avec la phrase « Je souffre beaucoup de l’éloignement de ma famille », QWAM Text Anaytics identifiera :

• Thème : éloignement de la famille
• Nature : frustration (« souffre »)
• Force : -2 (« beaucoup »)

Alors que, sur un forum automobile, si le verbatim est « L’allume cigare ne fonctionne pas très bien », ces valeurs seront :

• Thème : équipement tableau de bord (« allume-cigare »)
• Nature : constat (« fonctionne »)
• Force : -1 (« pas très bien »)

Ces opérations d’extraction et de qualification vont rendre possible la construction d’une base de données permettant de structurer ces données et de les exploiter par des outils de type de tableau de bord. Nous sommes bien dans le « mining » et le terme de « fouille d’opinions » est pleinement justifié.

Les applications sont nombreuses comme celle qui a été réalisée par BetterWorld à partir de forums automobiles (voir notre précédent billet).

Alors « analyse du sentiment » ou « fouille d’opinions »… Chez QWAM on est plutôt fouille car les enjeux sont gigantesques et que la technologie est disponible notamment avec QWAM Text Analytics qui se couple parfaitement avec Ask’n’Read pour la collecte des données.