Le centre Jean-Mabillon (EA 3624, École nationale des chartes) est un des lauréats du récent appel d'offres de l'IRIS « Science des données, Donnée de la Science » de l’université PSL.
L'IRHT et l'INRIA, ainsi que plusieurs institutions de conservation patrimoniale françaises (Archives nationales, Archives départementales des Alpes-Maritimes et du Rhône, Archives municipales de Toulouse, Bibliothèque municipale de Toulouse) sont associés à ce projet.
→ En savoir plus sur les programmes de recherche de l'IRIS
Le projet « Filigranes pour tous »
Le projet « Filigranes pour tous » vise à permettre le développement d'un outil de reconnaissance et d'identification partagées, sous forme entre autres d’une application pour smartphone, pour le papier médiéval et moderne.
Le filigrane, marque inscrite dans le papier par son fabricant, apparaît en Occident aux XIIIe et XIVe siècles et reste universellement en usage jusqu’à la fin du XVIIIe siècle. Observable par transparence dans la feuille, il comporte parfois un nom, voire une date, plutôt de simples initiales, mais privilégie le plus souvent des figures simples (animaux, végétaux, objets, symboles et signes géométriques divers). Ces marques sont propres à chaque papetier, mais aussi caractéristiques d’une région et d’une période plus ou moins limitée. Elles contribuent ainsi à dater et localiser l’origine d’un papier, mais permettent aussi d’observer sa diffusion plus ou moins large selon les lieux où il a été employé : la production de certaines régions circule en effet dès le Moyen Âge à l’échelle européenne, puis mondiale.
Le volume des filigranes recensés se compte en dizaines de milliers ; les répertoires existant sont surtout le fruit d’entreprises individuelles et restent modestes par rapport aux repérages possibles dans les centaines de millions de pages de documents conservés pour les XIVe-XVIIIe siècle.
Le projet proposé porte sur la création, à terme, d’un outil simple, puissant et de large diffusion, facilement utilisable en tout lieu, sous forme d’une application pour smartphone ou d'un site internet permettant de soumettre des images et d'obtenir rapidement des résultats d'identification.
Une première version de l'outil de reconnaissance sera élaborée à partir d'un corpus spécifiquement constitué pour apprendre et évaluer différents modèles de reconnaissance de filigranes. Ce corpus photographique, documenté dans une base de données, s'efforcera, pour la première fois, de rassembler des clichés multiples (et non des reproductions sous forme de dessins uniques) d'un même filigrane, en liaison avec des institutions de conservation patrimoniales françaises à Paris et en province. Il permettra de procéder aux premiers tests de reconnaissance automatique avec des méthodes simples (par exemple des algorithmes de plus proches voisins sur des descripteurs d'images adaptés), puis de tester des approches plus complexes, par exemple incluant l'apprentissage de l'invariance à certains facteurs spécifiques au problème, tels la présence de texte sur les feuillets.
Parallèlement à l'enrichissement de la base, l'application produite devra être perfectionnée pour pouvoir être installée sur un smartphone afin de permettre à l’utilisateur de contribuer en retour, par un crowdsourcing facilité, à l’enrichissement de la base de référence : en y ajoutant soit des formes nouvelles ou des variantes, soit des métadonnées nouvelles concernant au moins les dates et lieux d’origine et de diffusion/utilisation (y compris par géolocalisation).
Le public visé est très divers : professionnels des institutions patrimoniales (archives, bibliothèques, musées) qui conservent des documents sur support papier des époques concernées ; chercheurs travaillant sur des textes et œuvres sur papier et désireux de contribuer à les localiser et dater ; très large public dans le domaine du commerce, de l’expertise et des collections privées.
Contact : Olivier Poncet, professeur à l'École nationale des chartes et porteur du projet ( <!-- document.getElementById('7fcabfe4911afec8b5b8fd80ef54fc7b1cfad1d3').innerHTML = '<a href="mailto:olivier.poncet@chartes.psl.eu">olivier.poncet@chartes.psl.eu</a>'; // --> )