Les données textuelles représentent un défi pour l’automatisation de leur traitement et pour leur analyse. En effet, la langue, retranscription écrite d’une conception humaine, fait appel à de nombreuses notions de liens, d’émotions, de suggestions, de nuances qui ne sont pas appréhendables par les machines ou la technologie en tant que telles. Car si les technologies, les machines, sont très performantes lorsqu’il s’agit de répondre à des schémas mathématiques définis et récurrents, pour le reste… cela devient plus compliqué.

Faut-il cependant renoncer à faire appel aux « machines » pour faciliter le traitement de ces données – surtout lorsque l’on est face à des volumes importants ? La réponse est non, néanmoins il faut garder en tête que les algorithmes utilisés par ces machines nécessitent des actions humaines tant au niveau de leur conception que du traitement final des textes afin d’obtenir les résultats escomptés.

Que peut-on attendre de l’IA ?

L’intérêt de l’utilisation de l’intelligence artificielle prend tout son sens lorsque les volumes sont tels que le traitement humain n’est plus envisageable, et/ou que la contrainte temps est trop forte. L’exemple parfait est celui de l’analyse du Grand Débat pour laquelle QWAM a eu pour mission de traiter près de 2 millions de contributions dans un délai de moins d’un mois !

Soyons clairs : l’intelligence artificielle ne délivrera pas les conclusions finales. Elle va faciliter le travail de l’analyste ; elle est un outil performant à destination de l’humain. Et c’est là que réside sa force. De par ses algorithmes, elle va réaliser dans un premier temps des tâches de tri et de classification qui permettront à l’analyste de se concentrer sur la valeur ajoutée à apporter à l’ensemble des données.

Une collaboration machine + humain

L’analyse sémantique représente l’un des composants de l’intelligence artificielle appliquée au traitement des textes. Elle permet de détecter les entités nommées (personnes, sociétés, institutions, lieux) et de les catégoriser. De même pour les concepts. Néanmoins, ces derniers peuvent parfois être difficilement classés de façon automatique dans les catégories de par leur possible ambiguïté.

QWAM, dans le cadre de ses différents programmes de R&D, travaille de façon continue sur ses propres algorithmes de classification des vocabulaires par thématiques (environnement, santé, énergie, transport, agriculture, …). L’expertise humaine apportée par nos linguistes facilite ainsi le travail de l’IA.

L’intelligence artificielle va alors être en mesure de délivrer à l’analyste un premier classement statistique des thématiques et sous-thématiques présentes dans les corpus ou verbatims, grâce à un outil de datavisualisation. L’analyste aura ainsi une première mise en perspective des sujets traités. Seront mis en évidence les liens entre des concepts et des personnes ou des institutions, ou entre des sociétés et des personnes, …

Aller plus loin

Chez QWAM, nous proposons d’aller encore un peu plus loin. Les travaux de recherche menés par nos équipes R&D (ingénieurs, data scientists, linguistes) permettent à notre solution QWAM Text Analytics de qualifier la nature des sentiments exprimés (frustration, colère, peur, satisfaction, joie, euphorie, …) et de déterminer leur intensité en leur attribuant une note de -3 à +3.

De plus, QWAM Text Analytics reconnaît et met en évidence les suggestions qui peuvent être présentes dans un verbatim, par exemple dans le cadre de l’analyse des contributions du Grand Débat… nous vous invitons à revenir sur notre blog pour plus de détails dans un prochain billet !

L’IA (sémantique, deep et machine learning, NLP, NLU) s’impose aujourd’hui comme l’outil incontournable d’aide à l’analyse des Big Data textuelles. QWAM Text Analytics s’adapte aux problématiques de tout secteur grâce à la facilité de création et personnalisation des vocabulaires ou d’ontologies spécifiques.

N’hésitez pas à nous contacter pour en savoir plus !