Recensements Socface : 291 millions d'ancêtres à portée de clic

93 views
Skip to first unread message

Fabrice Bouffanet

unread,
Mar 27, 2026, 7:22:06 AMMar 27
to AGC16-forum
Bonjour,

Les premières données de projet SocFace sont disponibles.
Ce projet vise à indexer tous les noms de recensements de population en France entre 1836 et 1936. L'indexation a été faite automatiquement grâce à une technique de reconnaissance des caractères manuscrits.

Voici le lien vers l'article de la RFG:

La base SocFace est consultable ici:

Cordialement

    Fabrice BOUFFANET

Article RFG:

400 millions de noms ! C'est l'ambition de Socface de publier, à terme, un gigantesque index de noms issus des recensements de population français de 1836 à 1936. Pour l'instant, le projet vient de franchir une étape majeure, avec 291 millions de notices déjà en ligne au 17 mars 2026, consultables gratuitement sur le portail FranceArchives et le reste est attendu avant l'été. Une aubaine pour les généalogistes, alors que Socface a été conçu à l'origine pour répondre à une étude scientifique : analyser les mutations de la société française sur un siècle à travers ses recensements de population. 

Ce qui rend Socface inédit, c'est avant tout l'échelle et la méthode. Les généalogistes connaissent déjà les recensements, et certains y ont accès via des indexations proposées par des associations de généalogie, ou par des plateformes comme Filae ou Geneanet. Mais ces indexations restent partielles et disparates. Jamais les 20 recensements nationaux n'avaient été traités de manière systématique sur l'ensemble du territoire et sur un siècle ! C'est l'intelligence artificielle qui a rendu la chose possible.

La société Teklia, associée à l'INED et à l'École d'économie de Paris, a appliqué la reconnaissance automatique de caractères manuscrits à 18 millions d'images de recensements, fournies par les services d'archives départementales, municipales et les Archives nationales d'outre-mer. Une technologie capable de lire des millions de pages écrites à la main à une vitesse et une échelle inaccessibles à l'humain, et sans laquelle un tel projet n'aurait jamais vu le jour.

Le projet a été présenté le 24 mars 2026 aux Archives nationales à Pierrefitte-sur-Seine au cours d'une journée d'étude. Le résultat obtenu se compte finalement en milliards : la base intègre quelque 3,2 milliards de données, si l'on décompte les noms, prénoms, âges, professions, lieux de naissance, relations au chef de ménage, le tout consultable via un formulaire de recherche sur FranceArchives. Des opérateurs de type astérisque ou point d'interrogation permettent de compenser les variations graphiques fréquentes dans des documents du XIXe siècle retranscrits automatiquement. 

Car Socface n'est pas une base infaillible, et ses concepteurs le disent clairement : elle constitue un échantillon de données correctes auquel s'ajoutent des erreurs. Les sources elles-mêmes comportaient des lacunes, des archives détruites, des communes manquantes, des individus omis lors du recensement. Le traitement par IA a introduit ses propres approximations : transcriptions incorrectes, regroupements de ménages erronés, reconnaissance insuffisante des particularités régionales. Le taux de réussite oscille entre 70 % et 98 % selon les périodes et la structure des documents.

Ces limites étant posées, l'intérêt pour les généalogistes reste considérable. Retrouver un ancêtre dans plusieurs recensements successifs permet de reconstituer ses déplacements, ses changements de situation familiale ou professionnelle. Le lien direct vers les images numérisées des recensements n'est pas encore intégré à la base, mais il est prévu dans les versions futures. 


Jean Claude MIGNON

unread,
Mar 27, 2026, 3:04:54 PMMar 27
to agc16...@googlegroups.com

Merci Fabrice, 

c'est une info importante sur un système qui devra certes être perfectionné, mais évitera à l'avenir les saisies de recensement.

Pour les associations, cela permettra de faire porter les relevés sur d'autres postes.

quelques exceptions toutefois, je pense par exemple au recensement de Cognac 1856.

un seul registre qui n'existe qu'aux archives municipales de Cognac, (pas de double aux AD) et dont j'ai fait le relevé (environ 6.500/7.000 individus de mémoire) qui est dans notre base.

Bonne soirée

Amicalement

Jean Claude

--
Vous recevez ce message, car vous êtes abonné au groupe Google AGC16-forum.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse agc16-forum...@googlegroups.com.
Pour afficher cette discussion, accédez à https://groups.google.com/d/msgid/agc16-forum/1816e26b-2fde-4f6e-bf30-66d8c377e6d6n%40googlegroups.com.

Roger Faure

unread,
Mar 31, 2026, 12:07:09 PMMar 31
to agc16...@googlegroups.com

Bonsoir à tous,

et une autre base à consulter :

les réfugiés espagnols

https://archives.ofpra.gouv.fr/archive/resultats/espagnol/n:151?type=espagnol

Bonne soirée

Bien cordialement

Roger


Le 27/03/2026 à 12:22, 'Fabrice Bouffanet' via AGC16-forum a écrit :

Migout Gilles François

unread,
Apr 1, 2026, 5:05:19 AMApr 1
to 'Jean Claude MIGNON' via AGC16-forum

Bonjour,
Le nouveau système sur les recensements dépend apparemment d'une IA.
Il convient sans doute de prendre des précautions  pour vérifier que ce que la machine a fait correspond bien avec  ce qui a été humainement déjà fait. Le jour où l'IA permettra "apparemment" de lire tous les textes manuscrits vous arrêterez de relever?. 
Un outil qui sert à tout comme l'IA sert aussi à rien si ses résultats sont même un peu  erronés. Il convient de vérifier avant de lui faire confiance.
Je rappelle que les première machines-outils  ont fait perdre d'un coup leurs emplois aux ouvriers qu'on a rappelé bien vite quand la production a baissé... à cause de la machine. LA diffusion de l'IA semble revenir aujourd'hui sur d'"anciennes lunes""...
Relever des recensements est à la portée de tous et pourrait être à l'avenir  un moyen de formation au relevé systématique par exemple, Il ne faudrait pas " jeter  le bébé avec l'eau du bain.". Vouloir reporter les relevés sur d'autres documents manuscrits me semble un leurre tant que L'IA n' a pas fait "ses preuves" dans le domaine ...  Nos autos sont capables de rouler au delà de 200 km:est-ce vraiment utile puisque la vitesse est limitée?
L'IA a un cout, même écologique:: un releveur gratuit  qui reprend 10000 lignes de recensement ne génère aucun coût.. Qui va payer?

Au niveau des associations prudence doit etre à mon avis de mise: on s'apercevra bien vite que tel ou tel recensement manque ou que les informations sont erronées ce qui obligera à revenir au releveur humain...en tout ou partie.

Laissons du temps au temps. L'IA ne s'imposera que si elle est jugée totalement efficace dans le domaine concerné sinon à quoi bon? L'humain décideur final doit être persuadé que dans l'avenir  tel ou tel système automatique est fiable ce qui implique qu'il ne soit pas imposé(puisqu'on suppose qu'il l'est par défaut)... IL faut laisser le projet Scoface se terminer et chercher à vérifier les informations pour pouvoir en affirmer ou non la fiabilité... Même si le projet était une réussite, rien ne dit que le même genre de projet sur d'autres documents manuscrits le serait aussi... Pour moi un système IA doit être fiable : il peut l'être dans un domaine donné ou pas. Expérimenter ne veut pas dire adopter pour tout...

"Un service mal rendu n'est pas un service"...L'utilisateur final est le seul habilité a en juger...

cdlt
GF

Reply all
Reply to author
Forward
0 new messages