Le titre de ce billet peut surprendre car vouloir distinguer Visualisation et Structuration est étonnant dans la mesure où il est difficile de visualiser un « grand désordre » et que par conséquent, la structuration est implicite à la visualisation. Or, ces dernières semaines lors des congrès et salons où notre société participait, les visiteurs nous ont questionné sur l’originalité de l’approche QWAM Text Analytics et notamment ses différences avec des outils de visualisation.
En fait, QWAM Text Analytics propose les deux options, visualisation et structuration, cette dernière offrant des possibilités d’analyse beaucoup plus importantes. Voici quelques précisions qui vont permettre de distinguer les deux concepts et de comprendre leur complémentarité.
Les outils de visualisation permettent à un utilisateur de « naviguer » dans un ensemble de données en offrant diverses vues qui mettent en valeur les relations que ces données ont entre elles. Ils permettent des explorations qualitatives, pour obtenir à gros traits les tendances sans les chiffrer.
Par exemple, dans un corpus relatif à des avis de consommateurs sur un produit, identifier rapidement les groupes, et donc leurs caractéristiques socio-économiques, qui ont un avis plutôt positif. Ou inversement, ceux qui sont très négatifs. En mettant en évidence ces relations, ou leurs absences, l’utilisateur pourra ainsi découvrir que finalement un sous-groupe se détache par certaines spécificités, constat qu’il le conduira sans doute à identifier de nouvelles relations et de nouveaux sous-groupes.
Les outils de visualisation vont donc favoriser la sérendipité et seront précieux pour mettre en évidence des tendances que la volumétrie des données aurait rendu difficile à identifier par une simple lecture linéaire. Les outils de cartographie, notamment de navigation dans des graphes, sont souvent un élément déterminant de la qualité de cette visualisation.
Et la structuration ? Elle est indispensable pour la visualisation comme par exemple, pour déterminer les sous-groupes que nous évoquions précédemment. Mais l’enjeu n’est pas simplement celui-là. Prenons l’exemple du forum des clients Citroën : ceux-ci rédigent des avis ou commentaires sur les véhicules de la marque, qui peuvent être des critiques mais aussi un partage d’expériences, souvent très positifs d’ailleurs.
Un produit comme QWAM Text Analytics va permettre de structurer ces avis de clients dans le sens où il va construire une base de données qui regroupera selon un schéma relationnel déterminé les informations extraites des avis. Dans le cas du forum Citroën, le schéma relationnel est basé sur le modèle (Thème, Force). Ainsi, pour chaque véhicule, les différents composants et sous-composants ont été identifiés : tableaux de bord, roues, … et aussi allume-cigare, compteur, écrous antivols, bombe anti-crevaison, … constituent les Thèmes et Sous-thèmes sur lesquels les clients de la marque écrivent. Ensuite, pour chacun de ces Thèmes et Sous-thèmes une mesure de la Force avec laquelle l’internaute s’exprime est faite (*).
Thèmes, Sous-thèmes et Force constituent les colonnes des tables d’une base de données relationnelle, qui sont ensuite instanciées par les différents avis analysés, chaque avis étant une ligne de la table. En fait, l’opération de structuration va permettre de ramener dans un référentiel unique des verbatim, des données textuelles, qui sont hétérogènes. Ce référentiel permettra d’obtenir des résultats quantitatifs et d’obtenir des décomptes fiables.
L’opération de structuration est donc un processus complexe faisant appel à des technologies sophistiquées d’Intelligence artificielle. Elle va permettre de construire au fil du temps une base de données qui sera ensuite aussi exploitable… par des outils de visualisation.
En fait, en structurant des informations qui ne l’étaient pas, QWAM Text Analytics permet d’exploiter ces données avec des algorithmes qui sont parfaitement maitrisés depuis des années et en application dans les logiciels de Business Intelligence qui ont été conçus pour … des données structurées. Seule la structuration permet la quantification exacte.
QWAM Text Analytics permet ainsi de réconcilier deux univers : données non structurées et structurées. Nous prenions l’exemple du Forum Citroën car chacun comprend que connaître de façon très claire quels sont les critères d’appréciation d’un véhicule avec le niveau de précision proposé (écrous antivols, allume-cigare !) est un atout précieux pour la Direction des produits de la marque. De façon plus générale, l’approche de QWAM Text Analytics permet de passer d’une Analyse des sentiments à la « Fouille d’opinons » (Opinion Mining).
La même démarche s’applique à d’autres univers que celui de l’analyse des média sociaux, comme par exemple une structuration intelligente d’une base d’archives documentaires. Une indexation booléenne même optimisée par diverses techniques n’offre aux utilisateurs que des capacités de recherche assez limitées. En structurant ces archives avec QWAM Text Analytics, l’utilisateur pourra naviguer beaucoup plus aisément dans sa base.
Comment ? La réponse sera l’objet d’un prochain billet !
(*) Le lecteur pourra se rapporter à l’article ci-après pour plus de précisions :
http://blog.qwamci.com/voix-client-analyse-de-sentiments/