Tesseract 4 beta (persian) didn't recognize punctuations

54 views
Skip to first unread message

reza

unread,
May 22, 2018, 2:10:30 AM5/22/18
to tesseract-ocr
hi shree

I test tesseract 4 beta in persian, i think this version didn't support punctuation in image ? is this true ?
and when a english word is between persian words, tesseract couldn't recognize this english word !!! why ?
(i use commad -l fas+eng)

thanks

reza

unread,
May 22, 2018, 2:31:12 AM5/22/18
to tesseract-ocr
i attached a sample and its results.


نویسه‌خوان نوری!" که با سرواژه‌ی */:)0) شناخته می‌شود. عبارت است از تشخیص (۳6600۲۱]0070) خودکار متون موجود در
تصاویر اسناد و تبدیل آن‌ها به متون قابل جستجو و ویرایش توسط رایانه. تصویر سند غالبا توسط روبشگر یا دوربین دیجیتال تولید

test (fas+eng).png
test_fas_eng.txt
Reply all
Reply to author
Forward
0 new messages