Des nouvelles dans la Transcription par IA

74 views
Skip to first unread message

françois de villemandy de la mesnière

unread,
May 19, 2026, 7:11:55 PM (11 days ago) May 19
to AGC16-forum
Dans le dernier numéro de :  La Revue française de Généalogie 
J'ai été interressé par un article sur un développement de transcription par l'IA des écritures anciennes. le titre de l'article : Un nouvel outil gratuit de transcription d’écriture manuscrite avec l’IA.
La revue explique : Quentin Beaume, historien passionné et altruiste a peaufiné et augmenté ses outils gratuits destinés aux généalogistes. Tout d’abord, il a créé le site Genebase, pour dissocier ses travaux personnels  de son apport à la communauté généalogique.

On retrouve donc sur Genebase ce qu’il a élaboré au bénéfice de tous, notamment :

  • l'accès direct aux rubriques spécifique des archives départementales
  • le moteur de recherche de la base INSEE
  • 2900 fiches sur les métiers anciens
  • des tutoriels
  • de nombreux outils parmi lesquels le générateur d’histoire familialeet qui utilise brillamment l’intelligence artificielle.
  • mais surtout avec l'IA un nouvel outil d'aide à la transcription d'actes manuscrits anciens.
Je l'ai testé avec de vieux actes en ma possession des année 1540 à 1760, et j'avoue que le résultat m'a surpris. Certe le système commet des erreurs, ou se confronte à des "impasse" de compréhension, mais les résultats que j'ai obtenues sont ma foi très corrects dans l'ensemble. Ces résultats n'exempte pas d'une vérification poussées, mais la qualité d'ensemble m'a agréablement étonné.
Le système gratuit est limité à un certains nombre de transcription, ensuite il faut acheter des "droits" de transcription,, et il reconnait un certain nombre d'extension de document (la je n'ai testé que le format JPG). la Création d'un compte est entièrement gratuite. Si vous voulez un exemple, je peux le mettre dans une discussion bien que mes tests ne concerne pas la charente pour le moment; en effet je n'ai que des scans (en JPG) de photocopies d'actes charentais et là est le qualité ou le fond blanc des documents mais cela n'a pas voulu fonctionner. (à suivre donc).
François de Villemandy de la Mesnière

Jean Meslier

unread,
May 20, 2026, 10:51:47 AM (11 days ago) May 20
to AGC Groupe
Bonjour François,

Votre intervention sur le site de l’ AGC m’a beaucoup intéressé.
Dans la mesure de vos possibilités, je souhaiterais obtenir un exemplaire de votre test.
J’ai en ma possession un acte notarié sur parchemin et j’aimerais tenter une transcription.
Par avance merci. Je suis adhérente de l’AGC bien entendu.
Si vous pensez toutefois que cela risque de ne pas intéresser grand monde, vous pourriez me répondre sur mon adresse mail personnelle.
Bien cordialement 

Annie Meslier

--
Vous recevez ce message, car vous êtes abonné au groupe Google AGC16-forum.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse agc16-forum...@googlegroups.com.
Pour afficher cette discussion, accédez à https://groups.google.com/d/msgid/agc16-forum/30bdf54a-339b-4462-a013-dbfcee4483c8n%40googlegroups.com.

carol...@aol.com

unread,
May 20, 2026, 11:02:24 AM (11 days ago) May 20
to 'françois de villemandy de la mesnière' via AGC16-forum
Bonjour, 

Merci François pour ces informations précieuses. Je viens de m'inscrire sur Genebase et j'ai testé la transcription d'un CM que je lisais difficilement. O miracle ! La transcription est incroyable si on excepte quelques fautes d'orthographe.

Bonne journée,

Christine Grelet-Le Moigne


--

françois de villemandy de la mesnière

unread,
May 20, 2026, 6:10:26 PM (10 days ago) May 20
to AGC16-forum
Bonsoir vous trouverez en pièce jointe le résultat sur une photocopie (grisée) du registre des baptêmes protestant de La rochefoucauld que je viens de tester. dans l'outil de transcription dans https://Genebase.fr/                                      peut être faut-il "foncer" les scans pour que l'IA reconnaisse le document, car il avait échoué hier soir avec un document très blanc. 
exemple Genebase Charente.odt

Alain

unread,
May 21, 2026, 2:33:37 AM (10 days ago) May 21
to agc16...@googlegroups.com

Bonjour,

Merci beaucoup à François de Villemandy de nous avoir fait découvrir cet outil de reconnaissance d'écriture. Il faut bien reconnaître que c'est bluffant !

Cependant, je mettrais un bémol à l’enthousiasme que certains pourraient éprouver vis-à-vis de cette technique.

L'exemple joint montre quelques divergences entre l'interprétation de la machine (son « intelligence » étant artificielle, donc fictive), et l'interprétation humaine (la mienne en l’occurrence).

On constate un manque complet d'objectivité : là où il est écrit « cytoyen » ou « scavoir », la machine interprète « citoyen » et « sçavoir », à juste raison, certes, mais ce n'est pas ce qui est écrit… Alors, pourquoi la machine laisse un 's' à « chascun » ?

Voir aussi les deux dernière lignes, qui frôlent le délire et rendent le texte complètement incompréhensible…

Passe encore pour les noms propres.

Utilisons donc cet outil pour dégrossir, mais, de grâce, faisons le avec prudence, sans s'épargner une relecture attentive.

Très cordialement,

Alain

envoyé : 21 mai 2026 à 00:10
de : 'françois de villemandy de la mesnière' via AGC16-forum <agc16...@googlegroups.com>
à : AGC16-forum <agc16...@googlegroups.com>
objet : Re: [AGC16-forum] Des nouvelles dans la Transcription par IA

Extrait.JPG
Test.odt
Message has been deleted

françois de villemandy de la mesnière

unread,
May 21, 2026, 1:50:18 PM (10 days ago) May 21
to AGC16-forum
Bonjour Monsieur TEXIER; je n'en disais pas moins le système se heurte à des impasses (intranscriptibles pour lui et il le dit), où à de mauvaises compréhensions (lettres confondues, erreurs d'interprétation dans les majuscules ou dans les finales des termes, voire mésinterprétation du terme complet. je le montre dans les exemples envoyés (j'avais mis certaines corrections de mon fait entre parenthèses et en gras). Il n'en demeure pas moins que le résultat est bluffant (en comparaison à d'autre outils comme celui-là) et que c'est une belle aide. 
Il ne faut surtout pas prendre comme argent comptant le résultat brut. 
J'ai volontairement testé l'outil sur des textes relativement anciens 1500/1600 dont un avec des termes patoisants du béarn, car les plus difficiles de mon point de vue.....Pour ma part je continuerais à interpréter et à transcrire en lisant et relisant les "pattes de mouches" de nos ancêtres, des plus belles au plus "artistiques", mais dans l'urgence je ne me priverais pas de cette aide.
L'outil est tellement conscient de ses erreurs qu'il est possible de corriger le texte proposé dans la fenêtre de résultats (bouton en bas) et  à noter qu'il est également possible d'enregistrer directement celui-ci dans l'emplacement que vous lui donnez. De par cette possibilité de corriger, est ce à dire que cet outil IA est toujours en apprentissage (c'est possible)....
Cordialement, François.

Éveline MÉTIVIER

unread,
May 21, 2026, 2:10:41 PM (10 days ago) May 21
to 'françois de villemandy de la mesnière' via AGC16-forum
Bonsoir

J'observe les échanges depuis un moment ce qui permet de se poser.

Jamais je demanderai à l'IA de faire le travail pour moi.
C'est tellement un bonheur de lire dans le texte par exemple d'un inventaire? ces mots oubliés, ces mots inconnus, tout  simplement la vie de nos ancêtres qui se résume à un peu plus que la délivrance d'un travail fait par autrui.

J'aime la paléographie, je m'efforce de lire le  maximum (je parle du17ème et parfois un peu du 16ème) c'est un lourd travail et parfois si je ne trouve pas le mot qu'importe sur un autre texte je le trouverai... peut-être !

Je ne refuse pas les nouvelles méthodes, il a bien fallu que certains lisent pour en arriver là.
Je désire avant tout prendre du plaisir à la découverte et le plateau tout fait IA ce n'est pas pour moi.

J'ai juste voulu indiquer mon ressenti personnel même s'il est démodé.
Inutile de partir en polémique................
Amicalement Éveline MÉTIVIER

Le 21.05.26 à 19:50, 'françois de villemandy de la mesnière' via AGC16-forum a écrit :
--
Vous recevez ce message, car vous êtes abonné au groupe Google AGC16-forum.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse agc16-forum...@googlegroups.com.

Migout Gilles François

unread,
May 27, 2026, 3:40:26 AM (4 days ago) May 27
to 'Alain' via AGC16-forum

Bonjour,

J'ai de fait la double compétence historique  et informatique. Je n'en tire aucune gloire

je dis ici ma réticence à l'usage de l'IA : tout simplement avec un peu de temps devant soi l'humain fait aussi bien voire mieux...En plus ma passion est dans la paléographie pas la généalogie...
IL faut être d'une grande prudence comme vous dites sur l'IA (en tout...). Par défaut on est dans le "pas bien marche" et en plus les résultats s'apprécient suivant ce que l'on veut faire.
L'outil IA se veut "universel" donc pouvoir satisfaire professionnels et amateurs. L'historien appréciera les"scories" d'ancien français, les autres préféreront sans doute un français "plus classique".
Dans l'état, ca peut permettre l'apprentissage  de la lecture du texte manuscrit sur n'importe quel texte ou presque. Il faut avoir une bonne compréhension de l'"ancien français" pour pouvoir transcrire en français "courant"...
Dans beaucoup de cas, l'Ia fera comme tout logiciel OCR laissera des "erreurs" ou des manques que l'humain devra gérer seul.
Vous jugez  pour un manque d'objectivité(où est la subjectivité dans une transcription littérale?) alors qu'il s'agit de résultats d'une machine basés sur une pratique éprouvée de la paléographie.
Pour ma part je me permets, étant par hasard  un bon paléographe, d'aménager mes transcriptions ce qui permet de dépasser la simple interprétation d'historien. Je conviens qu'il n'y a pas lieu de maintenir une transcription littérale  du manuscrit tant qu'on n'altère pas le sens.

Pour les noms propres (patronymes et lieux), l'IA sera aussi défaillant que l'historien ou le paléographe puisqu'il faut dépasser là l'interprétation littérale et ce n'est pas encore "tout le temps"  à la portée de la machine...

Restons très prudents. A la limite il serait bon d'attendre que l'IA ait appris : rien ne dit que ce sera dans le bon sens...
S'essayer à l'Ia  sur des textes bien lisibles du 19e ou 20e siècle peut permettre de savoir ce que ca peut valoir.  Que personne ne croit qu'il ne faudra pas ou plus (grâe à l'IA)aller "mettre les mains dans le cambouis" pour rétablir un texte compréhensible sur le difficilement lisible pour nous...
En faire un outil pour "dégrossir" veut dire qu'on est capable de tout lire ce qui n'est pas toujours le cas et jamais pour l'immense majorité es généalogistes  et des amateurs. Restons humbles.
Je signale que même une numérisation mal faite d'un tapuscrit pourra être mal interprétée par un simple logiciel OCR et en français il y a encore des cas où il faut corriger les résultats d'un OCR simple...

Je ne veux pas pour ma part avoir à choisir entre un verre à moitié plein ou vide donc je préfère faire par moi même: au moins je sais toujours qui a fait l'erreur. Je sais qu'avec du temps on y arrive: l'IA devra s'améliorer par elle-même ou bien on reviendra à des résultats humains car  plus fiables.
Nos lectures sont  souvent interprétatives pour remédier au manque de lisibilité. Avoir  accès à des outils de retouche d'image (encres à palir ou noircir, fond à éclairer  etc...) peut sans doute nous suffire dans de nombreux cas pratiques. 
Veillons à ne pas générer de nouvelles "usines à gaz". L'IA ne doit pas être une panacée
La recherche généalogique est à la portée de tous. Ce n'est pas toujours le cas avec la lecture des textes manuscrits. restons humbles.

Si ca peut aider à bien comprendre ce qu'on peut ou non faire avec ou sans l'IA...
Beaucoup de généalogistes proposent déjà ds transcription aménagées dans leurs arbres internet: savoir les trouver permet de gagner du temps pour qui en a besoin...

cdlt

GF


--
Vous recevez ce message, car vous êtes abonné au groupe Google AGC16-forum.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse agc16-forum...@googlegroups.com.
Reply all
Reply to author
Forward
0 new messages