400 millions de noms ! C'est l'ambition de Socface de publier, à terme, un gigantesque index de noms issus des recensements de population français de 1836 à 1936. Pour l'instant, le projet vient de franchir une étape majeure, avec 291 millions de notices déjà en ligne au 17 mars 2026, consultables gratuitement sur le portail FranceArchives et le reste est attendu avant l'été. Une aubaine pour les généalogistes, alors que Socface a été conçu à l'origine pour répondre à une étude scientifique : analyser les mutations de la société française sur un siècle à travers ses recensements de population.
Ce qui rend Socface inédit, c'est avant tout l'échelle et la méthode. Les généalogistes connaissent déjà les recensements, et certains y ont accès via des indexations proposées par des associations de généalogie, ou par des plateformes comme Filae ou Geneanet. Mais ces indexations restent partielles et disparates. Jamais les 20 recensements nationaux n'avaient été traités de manière systématique sur l'ensemble du territoire et sur un siècle ! C'est l'intelligence artificielle qui a rendu la chose possible.
La société Teklia, associée à l'INED et à l'École d'économie de Paris, a appliqué la reconnaissance automatique de caractères manuscrits à 18 millions d'images de recensements, fournies par les services d'archives départementales, municipales et les Archives nationales d'outre-mer. Une technologie capable de lire des millions de pages écrites à la main à une vitesse et une échelle inaccessibles à l'humain, et sans laquelle un tel projet n'aurait jamais vu le jour.
Le projet a été présenté le 24 mars 2026 aux Archives nationales à Pierrefitte-sur-Seine au cours d'une journée d'étude. Le résultat obtenu se compte finalement en milliards : la base intègre quelque 3,2 milliards de données, si l'on décompte les noms, prénoms, âges, professions, lieux de naissance, relations au chef de ménage, le tout consultable via un formulaire de recherche sur FranceArchives. Des opérateurs de type astérisque ou point d'interrogation permettent de compenser les variations graphiques fréquentes dans des documents du XIXe siècle retranscrits automatiquement.
Car Socface n'est pas une base infaillible, et ses concepteurs le disent clairement : elle constitue un échantillon de données correctes auquel s'ajoutent des erreurs. Les sources elles-mêmes comportaient des lacunes, des archives détruites, des communes manquantes, des individus omis lors du recensement. Le traitement par IA a introduit ses propres approximations : transcriptions incorrectes, regroupements de ménages erronés, reconnaissance insuffisante des particularités régionales. Le taux de réussite oscille entre 70 % et 98 % selon les périodes et la structure des documents.
Ces limites étant posées, l'intérêt pour les généalogistes reste considérable. Retrouver un ancêtre dans plusieurs recensements successifs permet de reconstituer ses déplacements, ses changements de situation familiale ou professionnelle. Le lien direct vers les images numérisées des recensements n'est pas encore intégré à la base, mais il est prévu dans les versions futures.
Merci Fabrice,
c'est une info importante sur un système qui devra certes être perfectionné, mais évitera à l'avenir les saisies de recensement.
Pour les associations, cela permettra de faire porter les relevés sur d'autres postes.
quelques exceptions toutefois, je pense par exemple au recensement de Cognac 1856.
un seul registre qui n'existe qu'aux archives municipales de Cognac, (pas de double aux AD) et dont j'ai fait le relevé (environ 6.500/7.000 individus de mémoire) qui est dans notre base.
Bonne soirée
Amicalement
Jean Claude
--
Vous recevez ce message, car vous êtes abonné au groupe Google AGC16-forum.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse agc16-forum...@googlegroups.com.
Pour afficher cette discussion, accédez à https://groups.google.com/d/msgid/agc16-forum/1816e26b-2fde-4f6e-bf30-66d8c377e6d6n%40googlegroups.com.
Bonsoir à tous,
et une autre base à consulter :
les réfugiés espagnols
https://archives.ofpra.gouv.fr/archive/resultats/espagnol/n:151?type=espagnol
Bonne soirée
Bien cordialement
Roger