plik pdf stworzony z bitmap (skany stron ksiazki), tekst wyglada tak ->
http://i.imgur.com/WVBhFS1.png
To jest czcionka "gotyk niemiecki", a dokladnie: *fraktur* , ew. *fraktur*
*plain* , obie zainstalowane w systemie.
OCR:
polska wersja fine reader (z ustawieniem: jezyk niem., albo niemiecki
[luxemburg], albo niem [nowa pisownia] ) - wypluwa na dzien dobry taki
ksztalt worda:
http://i.imgur.com/YZLDbQ8.png,
ale po zamianie czcionki na *fraktur* , jest tak:
http://i.imgur.com/nTAwT9I.png
Nie da sie ukryc,ze rozpoznanie jest sredniej jakosci, najdelikatniej
mowiac.
Co robie *źle* ?
(btw:
o wiele slabsze, mniej wyrazne czcionki polskie, albo angielskie (i nawet
krzywe linie pisma) - FReader rozpoznaje/wklepuje do worda naprawde b.
dobrze; srednio znam FReader, okazjonalnie mam dostep,ale skonfigurowany
jest ok. Moze to kwestia tego, ze chociaz FR wie, co przeczytal/rozpoznal
znakowo, ale ma problem z samodzielnym wyborem czcionki dla worda, bo w
koncu nie jest to zadna lacinska, a taka jest wlasnie dobra dla tekstow
polskich/ang., wiec nic dziwnego, ze dobrze wychodza w wordzie...)