Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Probleme mit Texterkennung

1 view
Skip to first unread message

Joerg Fuchs

unread,
Sep 2, 1999, 3:00:00 AM9/2/99
to
Hallo Leute,

villeicht kann mir jemand in Sachen Texterkennungssoftware weiterhelfen.
Das Problem ist folgendes:

Ich habe Programmausdrucke von einem Programm mit englischem Quellcode und Deutschen Kommentaren.
Der Ausdruck wurde zu dieser Zeit noch auf einem 9 Nadel Matrix Drucker gemacht.
Nun möchte ich gerne das Programm einscannen, und in einer DOS-Text Datei umwandeln.
Ich habe daher das Programm Textbridge benutzt, daß meinem Scanner Marke "Heidelberger Linotype-Hell Jade2" im Bundel beigefügt war.
Leider werden nach der Texterkennung mehr als 50% der Wörter falsch oder gar nicht erkannt und übersetzt.
Wer hat daher Erfahrung mit Texterkennungsprogrammen oder hat einen Tip, was man bei der Scannerkonfiguration einstellen sollte? ( welche Auflösung beim Scannen u.s.w. )
Als Vorlage handelt es sich um S/W Ausdrucke im Dina 4 Format.
Welche Texterkennungsprogramme haben eine möglichst niedrige Fehlerquote?.
Wie sieht´s mit Omnipage aus?

Für Vorschläge aller Art zu diesem Thema wäre ich sehr dankbar
 

Gruß Jörg Fuchs
 

Wolfgang Lange

unread,
Sep 2, 1999, 3:00:00 AM9/2/99
to

.
Wer hat daher Erfahrung mit Texterkennungsprogrammen oder hat einen Tip, was man bei der Scannerkonfiguration einstellen sollte? ( welche Auflösung beim Scannen u.s.w. )
Als Vorlage handelt es sich um S/W Ausdrucke im Dina 4 Format.
Welche Texterkennungsprogramme haben eine möglichst niedrige Fehlerquote?.
Wie sieht´s mit Omnipage aus?

 

Textbridge hatte ich auch mal. Das Programm ist einfach nur Sch*****!!!

Jetzt benutze ich Finerader Standard was mal in einer Zeitschrift beilag. Im Gegensatz zur Prof.-Version fehlen lediglich einige Extras die ich aber

bisher noch nicht vermißt habe. Die Erkennungsrate ist außerordentlich gut, auch mit Tabellen hatte ich bisher keine Probleme.

Die Dokumente scanne ich normalerweise mit 300 dpi ein. Bei kleiner Schrift nehme ich auch schonmal bis zu 600 dpi.

 

Gruß

 

Wolfgang

Marco

unread,
Sep 3, 1999, 3:00:00 AM9/3/99
to
 
Joerg Fuchs <joerg...@GINKO.DE> schrieb in im Newsbeitrag: 37CE774C...@GINKO.DE...
Hallo Leute,

villeicht kann mir jemand in Sachen Texterkennungssoftware weiterhelfen.
Das Problem ist folgendes:

Ich habe Programmausdrucke von einem Programm mit englischem Quellcode und Deutschen Kommentaren.
Der Ausdruck wurde zu dieser Zeit noch auf einem 9 Nadel Matrix Drucker gemacht.
Nun möchte ich gerne das Programm einscannen, und in einer DOS-Text Datei umwandeln.
Ich habe daher das Programm Textbridge benutzt, daß meinem Scanner Marke "Heidelberger Linotype-Hell Jade2" im Bundel beigefügt war.
Leider werden nach der Texterkennung mehr als 50% der Wörter falsch oder gar nicht erkannt und übersetzt.

Wer hat daher Erfahrung mit Texterkennungsprogrammen oder hat einen Tip, was man bei der Scannerkonfiguration einstellen sollte? ( welche Auflösung beim Scannen u.s.w. )
Als Vorlage handelt es sich um S/W Ausdrucke im Dina 4 Format.
Welche Texterkennungsprogramme haben eine möglichst niedrige Fehlerquote?.
Wie sieht´s mit Omnipage aus?

Für Vorschläge aller Art zu diesem Thema wäre ich sehr dankbar
 

Gruß Jörg Fuchs
 

Hallo Jörg!

Hab ich richtig gelesen?! du willst einen Quellcode von einem Programm einlesen?? Also jedes OCR-Programm hat schon probleme bei normalem Text und guter Vorlage, und du hast nichtmal das.

Aber ich würde es an deiner stelle nochmals mit Abbyy FineReader >> (http://www.abbyy.ru/index.htm)versuchen. Auf der homepage gibt es so viel ich weiss eine zunächst uneingeschränkte demoversion die du 30 oder 60 tage testen kannst.

OmniPage hatte ich ganu am anfang mal, die hat aber überhaupt nix gebracht, ausserdem gibts die homepage nichtmehr.

Viel Glück!

Ciao
    -Marco-

Peter Vratny

unread,
Sep 7, 1999, 3:00:00 AM9/7/99
to
Hallo,

deine Meinung zu Textbridge kann ich teilen.
Die der anderen bzgl. Omnipage allerdings nicht.
Ich scanne sehr viel für eine Volltextdatenbank ein und habe mit
Omnipage 7 eine sehr gute Erfahrung gemacht.
Für Texte, die von Anfang an möglichst fehlerfrei sein sollen und
auch eine gewisse Quantität aufweisen, empfiehlt es sich, das Programm
vorher zu trainieren. D.h. Omnipage ist lernfähig bzgl. verwendetem
Font und bzgl. der Drucksorten bzw des Nadeldrucks.
Zahlt sich sicher aus (ist ein ähnliches Vorgehen wie bei
Spracherkennungs-Proggies, du scannst ein, laest OCRn und korregierst
haendisch, daraus lernt das Proggie und beim tatsaechlichem
Enddurchgang ist die Fehlerquote sicher unter 10%).
Texte scanne ich mit 300 dpi s/w beste Filterqualitaet des Scanners,
evtl. geschaerft.
Was ich dir auch empfehlen kann, ist zB der Rechtschreibpruefung
deiner OCR-Soft die Programmiersprache vorher beizubringen oder eben
in Word o.ae. zu korregieren. Dazu wuerde ich einen moeglichst langen
Quelltext der selben Sprache durch die Korrektur lassen und alle
Befehle und evtl. diverse Teile der Syntax ins Woerterbuch aufnehmen,
dadurch ersparst du dir sicher auch einige Arbeit beim OCRn.
Voraussetzung ist natuerlich, das der Quelltext lange genug ist um all
diesen Aufwand zu rechtfertigen, sonst bist du mit einem schnellen
Tipper der die Prog-Sprache kennt und vorlesen bzw. abtippen schneller
;-))

mfg
Peter

Ps.: Ich kann dir deine Scans auch mal durch mein Omnipage jagen und
die unkorregierten Texte retoursenden, falls du evtl. einen CD-Brenner
hast (denn 600MB Scans als mail-attachment sind evtl. etwas zuviel
;-))

Peter Vratny

unread,
Sep 8, 1999, 3:00:00 AM9/8/99
to
Tagchen,

siehe da! Ich schlage die neue Chip Okt/99 auf und finde einen
OCR-Programme Test.
Gewinner: Textbridge Pro 9.0

Da muss die Vollversion aber einiges mehr bieten als die - Scannern
beiliegenden - Lite-Versionen.

Preislich liegen Textbridge und Finereader (nur so BTW) ausserdem weit
ab von Omnipage. Haette ich kein Update-Recht, ich wuerde mit
Sicherheit die Fingern vom Caere-Produkt lassen :-(
Interessant waere, ob Caere ein Cross-Update von einer Text-Bridge
Lite Version akzeptiert. Dann kostet Omnipage Pro 9.0 nur DEM 300,--.
mfg
Peter

0 new messages