关于HappyOCR之六

40 views

Skip to first unread message

benliud

unread,

Dec 28, 2007, 2:56:17 AM12/28/07

to HappyOCR

整个系统都是采用GB编码来做的，因为开始做时UNICODE尚不流行，考虑到如果考虑到移植，则转为使用UNICODE比较合适，转换很简单，可以整
个系统转，也可以单独转主程序。

数据库中有两个表，一个字体表，一个网络表；字体表存放所有训练的字体，网络表存放网络权值。

数据库名：ocr.db

字体表：FontTable24
有三个字段：
Seq INTEGER
Code INTEGER
FontImage BLOB

网络表：FloatWeight
Code INTEGER
MidNum INTEGER
Weight BLOB

Code代表字的编码，MidNum代表网络的中间节点数，当前基本为3，可调节。为避免倒入相同的字，将来可以在字体表中加一个HASH项目。

当前主程序做识别时，直接从数据库导入网络数据，如需脱离数据库运行，需要有倒出网络的工具，目前没做。包含的程序在有关数据库时都是在操作本目录下的
ocr.db，所有程序最好放在同一个目录下运行，字体转化工具不需要数据库，可独立运行。

编译需要一些库比如sqlite，cximage，可采用VC6编译，也许可以用2005。比较简单不详述。

Reply all

Reply to author

Forward

0 new messages