Si le nombre de personnes sans emploi est repassé sous la barre des 3,5 millions, de façon assez paradoxale, le nombre d’offres d’emploi sans candidat est en « augmentation » comme l’indiquait Jean Bassères, Directeur général de Pôle Emploi, le 7 décembre dernier constatant que « le seuil de 200 000 offres non pourvues est franchi et annonçant la sortie prochaine d’une étude »(1).

Si dans certains secteurs, comme l’hôtellerie ou le bâtiment, la situation de l’emploi est tendue, pour tous les autres domaines d’activité, favoriser la recherche d’emploi en mettant en correspondance « demande » et « offre » demeure une préoccupation majeure que cherchent à résoudre beaucoup de « job boards ». Par exemple, LinkedIn favorise ce rapprochement en s’appuyant sur les « recommandations » des profils et des offres.

C’est en partant de ce constat que le projet ITER-RH (2), qui regroupe cinq partenaires MeteoJob, TalentSoft, Eptika, le LIP6 et QWAM Content Intelligence, a été créé. Sur une période de 36 mois, il a permis de réaliser une plateforme logicielle qui exploite les milliards d’informations du Big Data afin d’améliorer de manière importante les systèmes de recrutement. Il a bénéficié du financement de l’Etat au titre des Programmes d’investissements d’avenir et fait partie des 12 projets retenus à ce titre.

QWAM était tout particulièrement responsable des opérations de collecte de données sur le Web. Ugo Petit, ingénieur de l’équipe Ask’n’Read explique : « une des premières difficultés que nous avons rencontrées a été l’accès aux données de type petites annonces. Très vite, les grandes plateformes comme LinkedIn ont fermé leur API et interdit la collecte de données ».

La décision a été prise de faire évoluer le projet dans deux directions : en premier, crawler directement le Web et notamment les sites d’entreprises grâce à la solution QWAM Ask’n’Read (3) et en second, utiliser les sites publics d’emploi type APEC et CadreEmploi comme sources de petites annonces mais surtout comme relais des sites d’employeurs qui recrutent.

En effet, dans le deuxième cas, outre le fait que ces plateformes publient quotidiennement des milliers d’annonces, elles indiquent assez souvent le site de l’entreprise qui recrute. Or, en détectant ce lien dans l’annonce et en visitant les pages « emploi » de ce site, il est possible de découvrir d’autres annonces qui n’auraient pas été publiées sur la plateforme initiale. Le principe est assez simple : une société qui publie une annonce d’emploi a des fortes chances d’en publier d’autres. C’est très précisément cette capacité qu’a développé QWAM en parcourant automatiquement les hyperliens qui apparaissent dans une offre d’emploi. Une forme de sérendipité qui permet de découvrir des annonces mais surtout les entreprises habituées à en publier !

De plus, Ask’n’Read est utilisé pour sa puissance et sa capacité à crawler chaque jour des centaines de milliers de sites et de détecter la publication d’offres d’emplois et surtout d’identifier les sites qui les publient notamment les sites d’entreprises.

En fait ces deux approches, découverte d’annonce et découverte de sources les publiant, se combinent parfaitement. L’annonce est bien évidemment ce qui est recherché ; mais construire au fil du temps un sourcing des sociétés et organisations qui emploient va se révéler précieux. Ainsi, quotidiennement, les outils de QWAM peuvent vérifier si ces sites n’ont pas publié de nouvelles offres, sans même attendre que l’information soit disponible sur les principaux job boards.

Pour réussir ce projet, QWAM a dû relever un troisième challenge : détecter automatiquement ce qu’est une offre d’emploi. Comme l’indique Ugo Petit, « sur les sites spécialisés, l’information est suffisamment structurée pour que le résultat soit parfait. Mais sur le site Web d’une PME ou d’ETI, où les règles en la matière ne sont pas toujours respectées, l’affaire est beaucoup plus complexe ». Il a fallu développer un algorithme spécifique reposant sur des technologies de Machine Learning de l’Intelligence artificielle afin de résoudre ce problème. La bonne nouvelle est qu’il a été possible de converger vers un modèle stable permettant de distinguer les petites annonces d’emploi avec un taux de succès élevé – et ainsi de les mettre à disposition des autres partenaires du projet.

ITER-RH est un très bel exemple de l’intérêt de combiner un outil de crawling puissant, en l’occurrence Ask’n’Read et des modules d’analyses issus de QWAM Text Analytics, combinaison qui permet d’obtenir une solution automatique, robuste et parfaitement opérationnelle. Pour le bénéfice des autres partenaires du projet qui peuvent exploiter directement des données qualifiées.

(1) http://www.rtl.fr/actu/societe-faits-divers/pole-emploi-le-nombre-d-offres-d-emplois-non-satisfaites-en-augmentation-7791300368
(2) http://iter-rh.strikingly.com/
(3) http://www.qwamci.com/asknread