Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques

Par Thomas Constum (université Rouen Normandie)

Le projet POPP, Projet d’Océrisation des Recensements de la Population Parisienne (S. Brée et al, 2022) vise à constituer une vaste base de données à partir des recensements nominatifs de Paris de l’entre‑deux guerres, composés chacun d’environ 100 000 pages simples manuscrites sous forme de tableaux. Nous avons à ce jour traité les recensements de 1926, 1931, et 1936, ce qui représente un total d’environ 9 millions d’individus. Ce corpus est une source d’information primordiale pour les historiens, les démographes, les économistes ou les sociologues. L’objectif de notre communication est de décrire un système complet pour l’extraction d’informations de recensements historiques de la population. POPP est un projet qui a réuni des chercheurs en vision par ordinateur, en reconnaissance de formes et en démographie historique.

    Partager sur les réseaux sociaux

    À découvrir

    Découvrez d'autres productions de l'École sur les mêmes thématiques.

    Informatique et ingénierie documentaire

    Paris

    Démographie

    Base de données