- Congrès : JADT2022: 16th International Conference on Statistical Analysis of Textual Data (2022-07-06 - 2022-07-08)
- Directeur(s) : Univ. of Naples Federico II
- Éditeur : Edizioni Erranti
- Pages : 712-720
Résumé
Brevets d’invention et articles scientifiques représentent une source essentielle pour mesurer la production scientifique et technologique, servant de base aux analyses scientométriques les plus variées. Les noms d’auteurs et d’inventeurs constituent un identifiant pivot pour réaliser ces analyses, mais ils nécessitent d’être désambiguïsés. Par extension l’identification des inventeurs qui sont également des auteurs académiques est un problème non trivial. Nous proposons une méthode utilisant la classification internationale des brevets et l’API IPCCAT pour évaluer le degré de similarité entre le résumé du brevet d’un inventeur donné et ceux des articles de personnes homonymes, afin d’apparier des deux types de documents. La méthode est développée et qualifiée manuellement sur trois corpus de brevets issus de la base internationale Espacenet de l’OEB. Sur un jeu de 4679 brevets et 7720 inventeurs, nous obtenons un résultat de 2501 auteurs. L’algorithme proposé résout le problème général de la levée d’homonymie avec un taux d’erreur inférieur à 5%.
Partager sur les réseaux sociaux
Publications de chercheur
‘La Rochelle, notre commune patrie': the World of the Rochelais Huguenots before the Revocation of the Edict of Nantes
Publication de chercheur
Chapitre d’ouvrage
- Date de parution : 2025
Enhancing Arabic Maghribi Handwritten Text Recognition with RASAM 2: A Comprehensive Dataset and Benchmarking
Publication de chercheur
Communication dans un congrès Nouveauté
- Date de parution : 2024
Cross-Dialectal Transfer and Zero-Shot Learning for Armenian Varieties: A Comparative Analysis of RNNs, Transformers and LLMs
Publication de chercheur
Communication dans un congrès Nouveauté
- Date de parution : 2024