Groups
Sign in
Groups
HappyOCR
Conversations
About
Send feedback
Help
关于HappyOCR之六
40 views
Skip to first unread message
benliud
unread,
Dec 28, 2007, 2:56:17 AM
12/28/07
Reply to author
Sign in to reply to author
Forward
Sign in to forward
Delete
You do not have permission to delete messages in this group
Copy link
Report message
Show original message
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to HappyOCR
整个系统都是采用GB编码来做的,因为开始做时UNICODE尚不流行,考虑到如果考虑到移植,则转为使用UNICODE比较合适,转换很简单,可以整
个系统转,也可以单独转主程序。
数据库中有两个表,一个字体表,一个网络表;字体表存放所有训练的字体,网络表存放网络权值。
数据库名:ocr.db
字体表:FontTable24
有三个字段:
Seq INTEGER
Code INTEGER
FontImage BLOB
网络表:FloatWeight
Code INTEGER
MidNum INTEGER
Weight BLOB
Code代表字的编码,MidNum代表网络的中间节点数,当前基本为3,可调节。为避免倒入相同的字,将来可以在字体表中加一个HASH项目。
当前主程序做识别时,直接从数据库导入网络数据,如需脱离数据库运行,需要有倒出网络的工具,目前没做。包含的程序在有关数据库时都是在操作本目录下的
ocr.db,所有程序最好放在同一个目录下运行,字体转化工具不需要数据库,可独立运行。
编译需要一些库比如sqlite,cximage,可采用VC6编译,也许可以用2005。比较简单不详述。
Reply all
Reply to author
Forward
0 new messages