Dankon pro la informo, Roland,
Aliflanke la retejo malhavas sufiĉan informon por juĝi ĝian fidindecon. Eĉ ne estas dirite, en kiu jurisdikcio situas tiu entrepreno kaj kiujn leĝojn devas obei.
Se vere ili proponis kunlaboron, tio signifus senpagan transkribadon de dokumentoj, mi supozas, kio povas esti interesa aranĝo por multaj.
Por ke aliaj esperantistoj povu tiri de la fadeno kaj uzi tiun eblecon, estus bone, se vi plusendus al la listo ilian tutan lastan mesaĝon, se estas nenio konfidenca en ĝi.
Aliflanke, mi mem, en mia entrepreno, de jam du monatoj laboras en projekto pri aŭtomata transkribado de arĥivaĵoj. Temas pri la korespondado de la ĝenerala sekretario de la Institut d'Estudis Catalans (Instituto pri Katalunaj Studoj, fakte la Kataluna Akademio). Jen ekzemplo.
Ĉiujn tekstojn, kaj tajpitajn kaj manskribitajn,
procesas unue artefarita inteligento, sed poste ni, homaj
arĥivistoj, devas revizii la tuton. Interese, la algoritmo ne
estas uzata nur por transkribi, sed ankaŭ por resumi la
tekstojn, kio tre bone permesas al ĝi kaŝi siajn erarojn kaj
ŝajnigi sin pli inteligenta ol ĝi fakte estas. Kontrolo de la
rekta transkribo evidentigus erarojn multe pli klare.
Aliflanke, malgraŭ la supozo de Maria Niemyjska, tiuj maŝinoj ne estas superhomaj nek povas fari pli ol homo. Se la manskribo estas nelegebla, AI estas tute senpova. Mi alkroĉas ekzemplon de letero preskaŭ nelegebla, kiu eĉ ne ŝajnas latina skribo. Mi mem, diplomito pri kataluna filologio, apenaŭ komprenas unu aŭ du vortojn en ĉiu alineo. Kaj la maŝino ne povas kompreni pli. En ĉi tiu kazo, ĝi resumis:
"Jordi Rubió i Balaguer skribas al Ramon Aramon i Serra senkulpigante sin pro malfruo kaj komentante temojn rilatajn la Instituton pri Kataluna Studoj kaj aliaj akademiaj agadoj."Mi korektis jene:
"Jordi Rubió i Balaguer skribas al Ramon Aramon i Serra senkulpigante sin pro malfruo, klarigante siajn akademiajn engaĝojn, konsentante al dato por plenkomitata kunsido de la Instituto, kaj demandante la limdaton por liveri referaĵon por la festlibra volumo de la revuo Latinidaj Studoj honoranta Nicolau d'Olwer. Li finas komentante, ke li ne konsentas, ke la Instituto estu nomata 'akademio'."Mi povis perfektigi la resumon, ĉar jam konas la
korespondantojn, la ceteron de la arĥivo, kaj la diskutatajn
temojn, kio helpis deĉifri multajn malklarajn vortojn. Tamen IA
legas komprenante nenion kaj sekve ne kapablas logike dedukti.
Amike,
Rubeno
Por ke aliaj esperantistoj povu tiri de la fadeno kaj uzi tiun eblecon, estus bone, se vi plusendus al la listo ilian tutan lastan mesaĝon, se estas nenio konfidenca en ĝi.
Rubeno,
Jen la teksto de la lasta kontakto (15 februaro) de ma...@handwritingocr.com :
Given your role in preserving Esperanto materials, would you consider sharing your findings about our OCR capabilities in the archival community? Your professional evaluation could be valuable for others working with historical Esperanto and other documents.
Mi donis miajn komentojn pri tri poŝtkartojn kaj sendis du seriojn de leteroj, aldonante ke mi informos miajn kolegojn pri handwritingocr.com. Ne plu venis reago; eble intertempe listano ligis kontakton.
Laŭ mi la kvalitnivelo estas la maksimumo kiu nun estas atingebla por programo kiu analizas multajn lingvojn. Kresko de kvalitoj nur eblas plu trejnante la programon, ekzemple por unu lingvo aŭ unu manskribo.
Roland