Avec la régulation des transactions financières et une augmentation des contraintes liées à la compliance et/ou aux due diligence, l’automatisation de l’analyse des documents financiers est devenue une nécessité. Au cours de divers travaux de recherche et développement, QWAM s’est penchée sur l’analyse de ce type de documents.

Utiliser des technologies d’analyse sémantique, reposant sur des modèles issus de l’IA, pour construire des outils d’analyse financière est une voie que plusieurs acteurs ont empruntée. Ainsi il y a une dizaine d’années, des systèmes ont été développés à l’aide de « réseaux, graphes ou cartouches sémantiques » capables d’alimenter automatiquement une base de données enregistrant les prises de participation.

En théorie, ces systèmes découvraient et enregistraient des relations du type « X prend le contrôle de Y » ou « X acquiert Y % de Z »… Les sources de données principales étaient – et restent – la presse et les sites spécialisés d’informations financières.

La difficulté rencontrée venait des modèles eux-mêmes (réseaux, cartouches, …) et de la complexité de modéliser efficacement et durablement les relations pertinentes. Chacun sait que les façons d’exprimer ces concepts financiers sont bien aussi variables que l’humeur des financiers !

Une autre voie plus pragmatique a été suivie, notamment par la société QWAM avec l’outil QWAM Text Analytics ; et cette approche s’est montrée parfaitement opérationnelle. Elle permet d’effectuer des analyses très poussées de corpus et de fournir à un analyste une représentation graphique des relations recherchées. En dernier ressort, cet analyste décidera de la pertinence de la relation (est-ce bien une prise de participations ?) et de l’intérêt de l’enregistrer.

En résume, l’approche QWAM Text Analytics se décline en deux étapes :

  1. Détecter des relations sémantiques de type « prise de participation »
  2. Explorer l’espace par une visualisation de graphes mettant en évidence ces relations.

La première étape est réalisée grâce à l’annotateur sémantique de QWAM Text Analytics qui permet de découvrir automatiquement, et sans modélisation préalable complexe et difficile à maintenir, des relations comme :

  • Une société rachète une autre société
  • Une personne est nommée dans une société
  • Une société lance un produit
  • Une société participe à un événement

L’image en début de ce papier donne un exemple des relations extraites.

Ces relations peuvent être représentées de la manière suivante :

  • Un nœud origine avec des propriétés.
  • Un nœud destination avec des propriétés.
  • Une relation entre les deux avec des propriétés.

La 2eme étape, « Explorer l’espace par une visualisation de graphes… » a nécessité un travail d’analyse poussé pour offrir une ergonomie adaptée au travail d’un analyste financier et lui permettre de découvrir rapidement les informations relatives aux prises de participation.

Plusieurs idées clés ont été retenues parmi lesquelles :

  • Représenter l’intensité d’une relation (par exemple, la prise de participation étudiée est très commentée) en valuant/ faisant varier l’épaisseur des arcs du graphe.
  • Associer « taille du nœud » avec « fréquence de citations » de la société.
  • Construire des agrégats (à la façon d’un cluster) où sont regroupées les sociétés ayant des caractéristiques proches. Il est possible de mettre en évidence des opérations qui ne sont pas simplement « 1 -1 » mais « 1-N » comme l’illustre la représentation ci-après

Il devient alors très facile pour un analyste, de chercher à comprendre pourquoi QWAM Text Analytics a procédé au regroupement affiché. Et la réponse est souvent riche d’enseignement.

Pour en savoir, n’hésitez pas à nous contacter.