400 millions de noms ! C'est l'ambition de Socface de publier, à terme, un gigantesque index de noms issus des recensements de population français de 1836 à 1936. Pour l'instant, le projet vient de franchir une étape majeure, avec 291 millions de notices déjà en ligne au 17 mars 2026, consultables gratuitement sur le portail FranceArchives et le reste est attendu avant l'été. Une aubaine pour les généalogistes, alors que Socface a été conçu à l'origine pour répondre à une étude scientifique : analyser les mutations de la société française sur un siècle à travers ses recensements de population.
Ce qui rend Socface inédit, c'est avant tout l'échelle et la méthode. Les généalogistes connaissent déjà les recensements, et certains y ont accès via des indexations proposées par des associations de généalogie, ou par des plateformes comme Filae ou Geneanet. Mais ces indexations restent partielles et disparates. Jamais les 20 recensements nationaux n'avaient été traités de manière systématique sur l'ensemble du territoire et sur un siècle ! C'est l'intelligence artificielle qui a rendu la chose possible.
La société Teklia, associée à l'INED et à l'École d'économie de Paris, a appliqué la reconnaissance automatique de caractères manuscrits à 18 millions d'images de recensements, fournies par les services d'archives départementales, municipales et les Archives nationales d'outre-mer. Une technologie capable de lire des millions de pages écrites à la main à une vitesse et une échelle inaccessibles à l'humain, et sans laquelle un tel projet n'aurait jamais vu le jour.
Le projet a été présenté le 24 mars 2026 aux Archives nationales à Pierrefitte-sur-Seine au cours d'une journée d'étude. Le résultat obtenu se compte finalement en milliards : la base intègre quelque 3,2 milliards de données, si l'on décompte les noms, prénoms, âges, professions, lieux de naissance, relations au chef de ménage, le tout consultable via un formulaire de recherche sur FranceArchives. Des opérateurs de type astérisque ou point d'interrogation permettent de compenser les variations graphiques fréquentes dans des documents du XIXe siècle retranscrits automatiquement.
Car Socface n'est pas une base infaillible, et ses concepteurs le disent clairement : elle constitue un échantillon de données correctes auquel s'ajoutent des erreurs. Les sources elles-mêmes comportaient des lacunes, des archives détruites, des communes manquantes, des individus omis lors du recensement. Le traitement par IA a introduit ses propres approximations : transcriptions incorrectes, regroupements de ménages erronés, reconnaissance insuffisante des particularités régionales. Le taux de réussite oscille entre 70 % et 98 % selon les périodes et la structure des documents.
Ces limites étant posées, l'intérêt pour les généalogistes reste considérable. Retrouver un ancêtre dans plusieurs recensements successifs permet de reconstituer ses déplacements, ses changements de situation familiale ou professionnelle. Le lien direct vers les images numérisées des recensements n'est pas encore intégré à la base, mais il est prévu dans les versions futures.
Merci Fabrice,
c'est une info importante sur un système qui devra certes être perfectionné, mais évitera à l'avenir les saisies de recensement.
Pour les associations, cela permettra de faire porter les relevés sur d'autres postes.
quelques exceptions toutefois, je pense par exemple au recensement de Cognac 1856.
un seul registre qui n'existe qu'aux archives municipales de Cognac, (pas de double aux AD) et dont j'ai fait le relevé (environ 6.500/7.000 individus de mémoire) qui est dans notre base.
Bonne soirée
Amicalement
Jean Claude
--
Vous recevez ce message, car vous êtes abonné au groupe Google AGC16-forum.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse agc16-forum...@googlegroups.com.
Pour afficher cette discussion, accédez à https://groups.google.com/d/msgid/agc16-forum/1816e26b-2fde-4f6e-bf30-66d8c377e6d6n%40googlegroups.com.
Bonsoir à tous,
et une autre base à consulter :
les réfugiés espagnols
https://archives.ofpra.gouv.fr/archive/resultats/espagnol/n:151?type=espagnol
Bonne soirée
Bien cordialement
Roger
Bonjour,
Le nouveau système sur les recensements dépend apparemment d'une
IA.
Il convient sans doute de prendre des précautions pour vérifier
que ce que la machine a fait correspond bien avec ce qui a été
humainement déjà fait. Le jour où l'IA permettra "apparemment" de
lire tous les textes manuscrits vous arrêterez de relever?.
Un outil qui sert à tout comme l'IA sert aussi à rien si ses
résultats sont même un peu erronés. Il convient de vérifier avant
de lui faire confiance.
Je rappelle que les première machines-outils ont fait perdre d'un
coup leurs emplois aux ouvriers qu'on a rappelé bien vite quand la
production a baissé... à cause de la machine. LA diffusion de l'IA
semble revenir aujourd'hui sur d'"anciennes lunes""...
Relever des recensements est à la portée de tous et pourrait être
à l'avenir un moyen de formation au relevé systématique par
exemple, Il ne faudrait pas " jeter le bébé avec l'eau du bain.".
Vouloir reporter les relevés sur d'autres documents manuscrits me
semble un leurre tant que L'IA n' a pas fait "ses preuves" dans le
domaine ... Nos autos sont capables de rouler au delà de 200
km:est-ce vraiment utile puisque la vitesse est limitée?
L'IA a un cout, même écologique:: un releveur gratuit qui reprend
10000 lignes de recensement ne génère aucun coût.. Qui va payer?
Au niveau des associations prudence doit etre à mon avis de mise: on s'apercevra bien vite que tel ou tel recensement manque ou que les informations sont erronées ce qui obligera à revenir au releveur humain...en tout ou partie.
Laissons du temps au temps. L'IA ne s'imposera que si elle est jugée totalement efficace dans le domaine concerné sinon à quoi bon? L'humain décideur final doit être persuadé que dans l'avenir tel ou tel système automatique est fiable ce qui implique qu'il ne soit pas imposé(puisqu'on suppose qu'il l'est par défaut)... IL faut laisser le projet Scoface se terminer et chercher à vérifier les informations pour pouvoir en affirmer ou non la fiabilité... Même si le projet était une réussite, rien ne dit que le même genre de projet sur d'autres documents manuscrits le serait aussi... Pour moi un système IA doit être fiable : il peut l'être dans un domaine donné ou pas. Expérimenter ne veut pas dire adopter pour tout...
"Un service mal rendu n'est pas un service"...L'utilisateur final est le seul habilité a en juger...
cdlt
GF
Pour afficher cette discussion, accédez à https://groups.google.com/d/msgid/agc16-forum/0e459322-852e-42fa-bbfe-87ded59a2f03%40orange.fr.