L’analyse du langage naturel trouve de nombreuses applications au sein des entreprises, par exemple dans le domaine des Ressources Humaines, qui est en pleine transformation. L’une des limites de cette technologie demeurait la difficulté à s’adapter aux différents contextes métiers.

En effet l’apprentissage du contexte et vocabulaire métier est une étape préliminaire qui était jusqu’à peu complexe et onéreuse. La dernière génération des outils d’IA, les réseaux de neurones notamment, optimise et facilite cette étape.

Ivan Monnier, Directeur technique de QWAM, décrypte cette nouvelle donne.

 

Ivan Monnier, Directeur technique de QWAM

Sur quels types de cas d’usage sont utilisés les outils d’analyse du langage naturel et pour quels bénéfices ?

L’analyse de texte via des technologies d’IA répond pour les entreprises à des besoins bien identifiés. Deux types de cas d’usage représentent aujourd’hui la majeure partie des projets, l’analyse de la voix du client et celle des collaborateurs.

Exemple parmi d’autres, la surveillance du moral des personnels embarqués sur les navires de la Marine Nationale est cruciale. Dans tous les cas, il s’agit de définir des données structurées et exploitables à partir de l’information non structurée, le texte, en d’autres termes d’enrichir ce texte avec des métadonnées exploitables.

Exemple, une réflexion de marin, qui regrette l’absence de sa famille, va être catégorisée dans « célibat géographique ». La mesure des items dans toutes ces catégories donnera ensuite un indicateur sur le moral des personnels.

Qu’est-ce qui a changé dans les technologies utilisées dans ce domaine ?

Les approches antérieures, encore utilisées par une partie des solutions, reposent sur l’utilisation et la constitution préalables de vocabulaires métiers. Cette méthodologie très manuelle est une démarche coûteuse en ressources qui nécessite notamment un travail approfondi de linguistes.

Chez QWAM nous proposons une solution qui permet d’automatiser en grande partie ces étapes. Pour cela, nous mettons en œuvre des algorithmes de deep learning basés sur des réseaux récurrents, qui calculent la probabilité d’apparition des mots les uns par rapport aux autres. Cette approche probabiliste augmente de façon sensible le nombre de propriétés extraites du texte et ce, de façon automatique.

Comment adaptez-vous votre approche aux spécificités de chaque métier et de chaque contexte ?

Pour chaque projet, nous commençons par formaliser les catégories importantes. Comme par exemple, le « célibat géographique » dans le cas de la Marine Nationale. Une étape manuelle mais plus rapide que celle effectuée auparavant.

L’étape suivante consiste à entrainer le modèle avec des données. L’utilisation de technologies de deep learning accélère le processus. En quelques itérations, le modèle est capable d’offrir un bon niveau de fiabilité et de découvrir par lui-même de nouvelles propriétés associées aux textes.

L’extraction dynamique d’une quantité plus importante de métadonnées qu’avec les technologies classiques de Machine Learning ouvre la porte à des analyses plus fines. De plus, cette approche plus rapide, moins coûteuse et plus souple, évite de passer par une formalisation complète effectuée en amont.

Grâce au développement de l’intelligence artificielle et du « deep learning », les technologies de traitement du langage naturel sont plus simples à mettre en œuvre et moins onéreuses en ressources pour les entreprises.

Pour en savoir plus :

L’IA sur les textes : machine learning vs deep learning

Interview d’Ivan Monnier, CTO de QWAM suite à AI Paris