Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

OCR GUI

7 views
Skip to first unread message

Alexander Goetzenstein

unread,
Dec 25, 2023, 6:50:56 AM12/25/23
to
Hallo,
ich suche eine GUI für OCR (Tesseract ist installiert) unter tumbleweed,
die auch vorhandene PDFs (gescannte Dokumente) verarbeiten kann. Bei
meiner Suche bin ich auf cuneiform gestoßen, doch das verlangt uralte
libs, die nicht mehr aufzufinden sind (vermutlich zurecht, denn es wird
mehrfach von Memory leaks berichtet). Für gimagereader bin ich auch
nicht fündig geworden.

Ist tumbleweed da außen vor, oder gibt es da etwas?

Alternativ: wie kann ich auf der Kommandozeile tesseract dazu bewegen,
(auch mehrseitige) PDFs zu verarbeiten?


--
Gruß
Alex

Bernd Mayer

unread,
Dec 25, 2023, 7:09:48 AM12/25/23
to
Am 25.12.23 um 12:50 schrieb Alexander Goetzenstein:
Hallo,

ich verwende gscan2pdf zusammen mit Tesseract.

Das kann auch Images einlesen statt der Ausgabe vom Scanner.

https://gscan2pdf.sourceforge.net/

Ich verwende das unter Ubuntu, weil die Installation unter OpenSUSE-Leap
recht fummelig war.
Der letzte Installationsversuch ist allerdings schon länger her.
Ich muss das bei Gelegenheit doch noch mal versuchen.

https://duckduckgo.com/?t=ftsa&q=gscan2pdf+OpenSUSUE+Tumbleweed


Bernd Mayer

Bernd Mayer

unread,
Dec 25, 2023, 7:14:44 AM12/25/23
to
Am 25.12.23 um 13:09 schrieb Bernd Mayer:
> Am 25.12.23 um 12:50 schrieb Alexander Goetzenstein:
>> Hallo,
>> ich suche eine GUI für OCR (Tesseract ist installiert) unter tumbleweed,
>> die auch vorhandene PDFs (gescannte Dokumente) verarbeiten kann. Bei
>> meiner Suche bin ich auf cuneiform gestoßen, doch das verlangt uralte
>> libs, die nicht mehr aufzufinden sind (vermutlich zurecht, denn es wird
>> mehrfach von Memory leaks berichtet). Für gimagereader bin ich auch
>> nicht fündig geworden.
>>
>> Ist tumbleweed da außen vor, oder gibt es da etwas?
>>
>
> ich verwende gscan2pdf zusammen mit Tesseract.
>
> Das kann auch Images einlesen statt der Ausgabe vom Scanner.
>
> https://gscan2pdf.sourceforge.net/

Nachtrag, ungetestet:

"GUIs and Other Projects using Tesseract OCR":

https://tesseract-ocr.github.io/tessdoc/User-Projects-%E2%80%93-3rdParty.html


Bernd Mayer
0 new messages