Groups
Sign in
Groups
HappyOCR
Conversations
About
Send feedback
Help
关于HappyOCR之二
15 views
Skip to first unread message
benliud
unread,
Dec 28, 2007, 2:53:46 AM
12/28/07
Reply to author
Sign in to reply to author
Forward
Sign in to forward
Delete
You do not have permission to delete messages in this group
Copy link
Report message
Show original message
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to HappyOCR
HappyOCR的识别率还是不错的,相对清晰的图象,大约在99%左右,差点的一般在95%以上,可以识别彩色图象(会转换处理),有水平校准,有版
面分析,分块识别等,但没有表格识别,版面分析比较弱,因为没仔细研究过。曾经扫描过一本书来做测试,因为扫描质量还不错,识别率很高。可惜现在找不到
那些扫描文件了,包括训练好的网络数据也没有备份下来,导致程序缺少数据而无法运行。下面我还要提到这一点。
整个系统在windows下做的,不过移植到linux也不是很难,只是目前我没有时间来做,熟悉wxWindows的可能两周可以做完。以前一直用
sqlserver来学习和存储,这几天我把数据库改为sqlite了,方便些,不必装一个大型数据库了,从使用上来看,速度也没什么影响。
系统大约有这么一些东西:
1。字库转换工具,可以把windows下的字库转换成不同分辨率的点阵字库用于训练。整个系统采用的是24*24点阵,不过这个工具可以转换许多分辨
率的点阵。
2。字库导入工具,可以把转换的字库导入到数据库里,这样方便训练网络。
3。训练工具,可以提取数据库中的字体训练网络,并且把训练好的网络写回数据库存放。
4。文件字体和数据库字体查看器。
5。主体程序HappyOCR,初始化时读进网络数据,然后读图象即可识别文字。
Reply all
Reply to author
Forward
0 new messages