Transformation numérique et données textuelles

Dans notre précédent billet, nous soulignions la dualité de la transformation numérique des entreprises : dans ses processus d’abord, mais surtout dans la valorisation de ses données. Ces dernières peuvent être internes ou provenir de sources externes et intéresser directement l’entreprise. Ce patrimoine informationnel s’est considérablement accru avec le Big Data, et notamment de données textuelles qui sont peu ou pas structurées.

Ce nouvel enjeu de valorisation de ce patrimoine est crucial et s’inscrit bien dans ceux de la transformation numérique : il est inutile de remplir des téraoctets de disques durs si ces contenus ne sont jamais exploités, les simples fonctions d’archivage devenant rapidement inopérantes face à de telles volumétries.

Or, les tendances sociétales actuelles ne vont que renforcer cette croissance des données textuelles. L’une d’elles est le développement des audits et rapports d’analyse, tendance qui, par exemple, apparait clairement dans le nouveau règlement général sur la protection des données personnelles (1). La recherche de transparence et de responsabilisation amène à la rédaction de nombreux rapports, qui au fil du temps vont représenter une volumétrie importante notamment pour les grandes entreprises. S’assurer de la cohérence de l’ensemble va nécessiter des outils puissants et un simple archivage risque de s’avérer de peu d’utilité.

Un autre exemple est celui des actes liés à l’immobilier qui, pour la plupart, sont numérisés en tant qu’image (sans traitement de type OCR) et surtout avec une indexation très limitée, généralement la date et les parties prenantes de la transaction. Or, chacun sait que ces transactions sont extrêmement intéressantes sur la nature des biens échangés – et donc la réalité d’un secteur économique, agricole, industrielle, … – sur les lieux de vente, le détail des transactions… Les organisations en charge de ces actes saisissent dans des bases de données ces éléments ; il s’agit donc d’une opération de ressaisie avec les limites que l’opération comporte en termes de complétude et d’erreurs possibles. Par ailleurs, là aussi en termes de transformation numérique sous l’angle « amélioration des processus », il y aurait beaucoup à faire !

Enfin, avec les média sociaux, l’habitude prise par les internautes de donner leur avis sur « tout » a son pendant dans le monde professionnel. Le développement de questionnaires ouverts sur des sujets relatifs à la vie de l’entreprise crée des volumétries sans cesse croissante avec une difficulté réelle dans leur exploitation. Chez QWAM, nous l’avons constaté avec plusieurs DRH où cette recherche d’ouverture et de dialogue avec le personnel – donc bien au-delà des QCM – nécessite un dispositif technique pour valoriser pleinement les résultats. La même observation peut être faite pour les collectivités locales : les consultations publiques, qui étaient jusqu’à présent organisées autour de réunions publiques, se dématérialisent. De nouvelles données sont créées avec des avis intéressants et plus ouverts : chacun sait que les réunions publiques sont souvent le lieu d’opposition politique quel que soit le projet. La dématérialisation, qui n’élimine pas ce caractère polémique, donne plus facilement la parole à des citoyens anonymes qui souvent ne la prenait pas. Encore faut-il avoir les moyens de les écouter et donc d’analyser ce qu’ils disent.

Ces tendances sociétales ne font que renforcer le besoin d’analyse des données de l’entreprise – le plus souvent textuelles – et qui est inhérent à leur transformation digitale. Encore une fois, à quoi bon enregistrer des données si elles ne sont jamais valorisées. Reposant sur des technologies d’Intelligence artificielle, QWAM Text Analytics s’inscrit dans cette logique en offrant des moteurs d’extraction et de découverte qui donnent du sens à des corpus de textes.

(1) https://www.cnil.fr/fr/reglement-europeen-sur-la-protection-des-donnees-ce-qui-change-pour-les-professionnels


Publié

dans

Étiquettes :