关于HappyOCR之六

40 views
Skip to first unread message

benliud

unread,
Dec 28, 2007, 2:56:17 AM12/28/07
to HappyOCR
整个系统都是采用GB编码来做的,因为开始做时UNICODE尚不流行,考虑到如果考虑到移植,则转为使用UNICODE比较合适,转换很简单,可以整
个系统转,也可以单独转主程序。

数据库中有两个表,一个字体表,一个网络表;字体表存放所有训练的字体,网络表存放网络权值。

数据库名:ocr.db

字体表:FontTable24
有三个字段:
Seq INTEGER
Code INTEGER
FontImage BLOB

网络表:FloatWeight
Code INTEGER
MidNum INTEGER
Weight BLOB

Code代表字的编码,MidNum代表网络的中间节点数,当前基本为3,可调节。为避免倒入相同的字,将来可以在字体表中加一个HASH项目。

当前主程序做识别时,直接从数据库导入网络数据,如需脱离数据库运行,需要有倒出网络的工具,目前没做。包含的程序在有关数据库时都是在操作本目录下的
ocr.db,所有程序最好放在同一个目录下运行,字体转化工具不需要数据库,可独立运行。

编译需要一些库比如sqlite,cximage,可采用VC6编译,也许可以用2005。比较简单不详述。
Reply all
Reply to author
Forward
0 new messages