L’École à la troisième place d’une compétition consacrée à la détection des glyphes sur des papyrus grecs

L’équipe du master « Humanités numériques » (HN) de l’École nationale des chartes - PSL s’est classée à la troisième place de la compétition « Detection and recognition of Greek Papyri letters », organisée du 21 au 26 août à San José (États-Unis) dans le cadre de l’International Conference on Document Analysis and Recognition (ICDAR 2023).

Objectifs de la compétition « Detection and recognition of Greek Papyri letters »

Cette compétition a pour but d’évaluer la détection et la reconnaissance des glyphes sur un type de document historique très complexe : les papyrus grecs. La détection et la reconnaissance des lettres grecques sur les papyrus constituent une étape préliminaire à l’analyse informatique de l’écriture manuscrite, qui peut conduire à des avancées majeures dans notre compréhension de cette source d’informations sur l’Antiquité. Ce travail peut être accompli manuellement par des papyrologues qualifiés, toutefois il s’agit d’une tâche chronophage qui nécessiterait d’être automatisée.

La compétition vise à surmonter deux tâches différentes : la localisation et la classification des caractères, ou la classification des caractères uniquement. Elle porte sur des documents très variés (différents styles, différentes périodes, documents endommagés, numérisations en basse résolution, etc).

Participation de l’École et résultats

L’équipe de l’École est composée d’un groupe d’étudiants du cours de python du master « Humanités numériques » : Noé Leroy (étudiant en master 2), Carolina Macedo (étudiante en master 1), Violette Saiag (étudiante en master 2), Chahan Vidal-Gorène (doctorant au Centre Jean-Mabillon, enseignant python du master « Humanités numériques ») et Malamatenia Vlachou Efstathiou (étudiante en master 2).

Réalisation de l’équipe du master « Humanités numériques » dans le cadre de la compétition « Detection and recognition of Greek Papyri letters »

Elle est arrivée troisième de la compétition (détection et classification des caractères) en adaptant un réseau de neurones composé de plusieurs couches CNN habituellement conçu pour une détection rapide et précise en temps réels des objets dans des images, spécialisé pour l’occasion sur l'analyse de documents manuscrits endommagés. La solution retenue repose donc sur une approche de vision par ordinateur considérant chaque caractère comme un objet (au même titre qu'une voiture dans des applications plus courantes).

La haute variabilité du corpus et la faible représentativité de certains caractères a nécessité la mise en place d’une stratégie de data augmentation très importante pour maximiser l’extraction d’informations contextuelles. En particulier, afin de surmonter l’endommagement de certains caractères, de nombreuses dégradations fictives sont appliquées durant l’apprentissage du modèle pour le forcer à les reconnaître malgré l’absence d’informations.

Accéder aux résultats détaillés (article des organisateurs)