APPLY_BOXES: boxfile line FAILURE! Couldn't find a matching blob for മ in malayalam

51 views
Skip to first unread message

rkvsraman

unread,
Oct 22, 2016, 8:50:54 AM10/22/16
to tesseract-ocr
Hello, 


I am training tesseract for malayalam.  The tif and the box files and the tesstrain log are shared here https://drive.google.com/drive/folders/0Bz8Xp0bwrlkdblNWMEZnaGpWTEk?usp=sharing 

Surprisingly i get errors for only the blobs which have the character മ  in them. 

These blobs are:

മ്
മം
മാ
മി
മീ
മു
മൂ
മ്മ
മ്മം
മ്മാ
മ്മി
മ്മീ
മ്മേ
മ്മ്യ
മ്മ്യാ

I checked the tif and box file using http://zdenop.github.io/qt-box-editor/ and it all looks fine. 

Any idea why this could happen. 

-Raman
Reply all
Reply to author
Forward
0 new messages