sheet-readerとKOCRの統合とテストケースのコミットについて

4 views
Skip to first unread message

Takashi Okumura

unread,
Jun 23, 2012, 5:11:58 AM6/23/12
to fax...@googlegroups.com
青木さん、有難うございました。助かります。

さて、それで、大変時間が掛かってしまいましたが、今回、
Shinsai faxocr用にご寄贈頂いたOCRエンジン、KOCRを
実際にfaxをOCR処理する要であるsheetreaderから利用
するためのコードをコミットしました。また、デバッグと性能
向上の作業を円滑化するために、実際に収集したfaxの
tif画像を読んで自動的に答え合わせをする簡単なテスト
ケースも作成しました。これで、読み取り性能向上のため
の作業が、一気に簡単になったと思います。

そんなわけで、お願いなのですけれども、どなたか、この作業
をお引き受け頂けませんでしょうか。既に公開されたkocr/src、
sheet-reader/srcとsheet-reader/testsを眺めながら、テストケー
スの読み取りを向上させていく作業となります。必要な知識と
しては、中級クラスのCとopencvの入門的な知識で、作業が
明確なだけに、そこまでハードルが高い内容ではないと思います。

作業環境の構築としては、下記のインストールを終えてあれば
ベストですが、基本的にはOCR部分のデバッグですから、コン
パイルに必要なパッケージのインストールだけで足りるはずです。

https://sites.google.com/site/faxocr2010/install-documents/on-premises

モジュール毎に効率的に開発が進められるよう、コードを整理
してきて、ようやくここまでたどり着きました。技術的にも面白い
作業で、勉強にもなるかと思いますので、特に若い方など、どう
かよろしくお願いします。。。


奥村 貴史

2012/6/22 Kentaro AOKI <kentar...@gmail.com>:
> 奥村さんありがとうございます。
>
> 取り急ぎ利用する必要があると思いますので、
> 下記のように修正です。
>
> 050のテストデータで確認したところ問題なく取得できました。
>
> 38c38
> < char *messageplus_tag =
> "_[0-9][1-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9].tif";
> ---
>> char *messageplus_tag = "_[0-9]+.tif";
>
> リポジトリが復活したときに、修正します。
>
> 青木
Reply all
Reply to author
Forward
0 new messages