プロジェクトの近況について

22 views
Skip to first unread message

Takashi Okumura

unread,
Sep 9, 2012, 7:46:23 AM9/9/12
to fax...@googlegroups.com
ご無沙汰いたしております。

先ほど、長らくの懸案だったShinsai faxocrのgitリポジトリに
おけるディレクトリ構成の大幅見直しを行いました。また、
既知の問題点について、さまざまなデバッグを行った版を
コミットしました。

あとは、軽量OCRエンジンであるKOCRと、実際のファクス
読み取りプログラムであるsheetreaderとの連携を調整すれば、
ある程度人手を掛けたテストに移れると考えています。

そんなわけで、Live CD作ります!とか、マニュアル作成
手伝います!など、お力お借りできる方を募集しています
ので、どうかお気軽にご連絡下さい。

https://sites.google.com/site/faxocr2010/home/opensource

また、KOCRの更なるチューニングをしてみたいという方も、
大募集させて頂きます。画像処理系のコードや機械学習に
興味がある方など、ぜひ、お気軽にご参加頂ければ幸いです。

どうかよろしくお願いします。。。


奥村 貴史

Takashi Okumura

unread,
Sep 13, 2012, 11:35:12 AM9/13/12
to fax...@googlegroups.com
こんばんは。

2012/9/9 Takashi Okumura <ta...@wide.ad.jp>:
>
> あとは、軽量OCRエンジンであるKOCRと、実際のファクス
> 読み取りプログラムであるsheetreaderとの連携を調整すれば、
> ある程度人手を掛けたテストに移れると考えています。

sheetreaderのOCRエンジンとして、KOCRを利用できるように
整理して、先ほどコミットしました。また、KOCRから、GOCRに
戻す方法も、インストールマニュアルに追記しました。

https://sites.google.com/site/faxocr2010/install-documents/on-premises

ちょっと今まで分かりにくかったsheetreaderへのKOCR組み
込みについて整理されて、また、文字認識のテストケースも
作成、調整しましたので、OCR処理の品質管理、性能向上が
図りやすくなりました。

デモ環境への反映には、少しまだ時間がかかりますが、ぜひ
触ってみたいという方は、上記のインストールマニュアルをご
参考に、どうかご自由にお試し下さい。インストール上はまった
点や注意などのフィードバックも、歓迎させて頂きます。

どうかよろしくお願いいたします。


奥村 貴史

Takashi Okumura

unread,
Sep 13, 2012, 12:52:31 PM9/13/12
to fax...@googlegroups.com
KOCR+sheetreaderの性能評価ですが、URLを見てインス
トールしてみて!だけではあんまりなので、OCR性能のみ
確認できるよう、必要最小限のインストールマニュアル?ら
しきものを作成してみました。

どなたか、テストして、適宜、ご意見を反映させてみて頂け
ませんでしょうか?動かない!等のレポートもお待ちしてお
ります。

どうかよろしくお願いします。


奥村 貴史

- 下記を実行し、必要なパッケージをインストールして下さい。

apt-get install netpbm
apt-get install gocr
apt-get install libcv-dev
apt-get install libhighgui-dev
apt-get install libcvaux-dev

apt-get install subversion (← Subversion が install されていなければ)

** Cluscore インストール

svn checkout http://cluscore.googlecode.com/svn/trunk/ cluscore
cd cluscore
./configure
make
make install

* kocrのチェックアウトとコンパイル

kocrをチェックアウトし、コンパイルします。

git clone https://code.google.com/p/kocr

そのうえで、srcにてmake libraryして下さい。libkocr.aが作成されます。

make library

** sheetreader のチェックアウトとコンパイル

kocrをチェックアウトしたディレクトリで、sheetreaderもチェックアウトし、
コンパイルします。

git clone https://code.google.com/p/sheet-reader

cd sheetreader
./configure
make

これで、KOCRを組み込んだ実行ファイルsheetreaderができる
はずです。sheetreaderが正常にコンパイルされたコトを確認した
うえで、testsディレクトリに移動し、makeを実行して下さい。

cd ../tests
make

faxからのOCR処理のテストケースが5件ほど動き出すはずです。


2012/9/9 Takashi Okumura <ta...@wide.ad.jp>:
>>
>> あとは、軽量OCRエンジンであるKOCRと、実際のファクス
>> 読み取りプログラムであるsheetreaderとの連携を調整すれば、
>> ある程度人手を掛けたテストに移れると考えています。
>
> sheetreaderのOCRエンジンとして、KOCRを利用できるように
> 整理して、先ほどコミットしました。また、KOCRから、GOCRに
> 戻す方法も、インストールマニュアルに追記しました。
>
> https://sites.google.com/site/faxocr2010/install-documents/on-premises
>
> ちょっと今まで分かりにくかったsheetreaderへのKOCR組み
> 込みについて整理されて、また、文字認識のテストケースも
> 作成、調整しましたので、OCR処理の品質管理、性能向上が
> 図りやすくなりました。
>
> デモ環境への反映には、少しまだ時間がかかりますが、ぜひ
> 触ってみたいという方は、上記のインストールマニュアルをご
> 参考に、どうかご自由にお試し下さい。インストール上はまった
> 点や注意などのフィードバックも、歓迎させて頂きます。
>
> どうかよろしくお願いいたします。

Mayumi Nakamura

unread,
Sep 16, 2012, 9:14:37 PM9/16/12
to fax...@googlegroups.com
構築しきるには至っていないのですが。

自宅の CentOS (CentOS 5) なマシンを recovery せざるを
得ない状況に迫られたので、作業しつつ、試しに最新の Debian
( 6.0.5 ) と CentOS ( 6.3 ) で、install 手順を踏んでみたのですが、
この(下記野の) 段階にたどり着く前の段階、現在サイトにある情報
だけだと、error が出てきました。

Debian 側は、
OSが新しくなった分、ライブラリ関係が少し変わっているようで、
標準で入っていたり、追加で必要なものがあったり、パッケージで
入れられなくなっていたり。

CentOS 側は、
Debian に比べると、初期install で入る 画像処理周りのライブラリ
が弱く(少なく)、これの前にこれを入れて、と順を追って入れないと、
という点もあったりで、これを解読していくだけで大変(面倒)という
感じです。

(少し見ましたが、解読しきるまでの気力が続かず)




2012/9/14 Takashi Okumura <ta...@wide.ad.jp>:
--
-----------------------------------------------
Mayumi Nakamura

Masakazu Nakano

unread,
Sep 18, 2012, 1:12:55 AM9/18/12
to fax...@googlegroups.com, Mayumi Nakamura

なかのです

なるべくネットへの接続を制限した standalone な環境で動かす事を前提として、

対象OS(のバージョン)を制限してしまうのも一つの方法です。

でないと、開発側もユーザー側も苦しめ(ら)れます…

なかの
なかの
http://andnow.co はじめました

Mayumi Nakamura

unread,
Sep 18, 2012, 3:38:14 AM9/18/12
to fax...@googlegroups.com
Debian を入れてみたマシン、key bind が違ったりで、
大変なので、もう消してしまいますが、一番最初に
ひっかかるのは、 gem install mysql です。
詳しく調べていないのですが、さすがに4.xベース
→ 6.x だと、いきなりは厳しいのかな、という感想、
ですね。

例えばこんな↓感じです。

# gem install mysql
Building native extensions. This could take a while...
ERROR: Error installing mysql:
ERROR: Failed to build gem native extension.

/usr/bin/ruby1.8 extconf.rb
checking for mysql_query() in -lmysqlclient... no
checking for main() in -lm... yes
checking for mysql_query() in -lmysqlclient... no
checking for main() in -lz... no
checking for mysql_query() in -lmysqlclient... no
checking for main() in -lsocket... no
checking for mysql_query() in -lmysqlclient... no
checking for main() in -lnsl... yes
checking for mysql_query() in -lmysqlclient... no
checking for main() in -lmygcc... no
checking for mysql_query() in -lmysqlclient... no
*** extconf.rb failed ***
Could not create Makefile due to some reason, probably lack of
necessary libraries and/or headers. Check the mkmf.log file for more
details. You may need configuration options.

Provided configuration options:
--with-opt-dir
--without-opt-dir
--with-opt-include
--without-opt-include=${opt-dir}/include
--with-opt-lib
--without-opt-lib=${opt-dir}/lib
--with-make-prog
--without-make-prog
--srcdir=.
--curdir
--ruby=/usr/bin/ruby1.8
--with-mysql-config
--without-mysql-config
--with-mysql-dir
--without-mysql-dir
--with-mysql-include
--without-mysql-include=${mysql-dir}/include
--with-mysql-lib
--without-mysql-lib=${mysql-dir}/lib
--with-mysqlclientlib
--without-mysqlclientlib
--with-mlib
--without-mlib
--with-mysqlclientlib
--without-mysqlclientlib
--with-zlib
--without-zlib
--with-mysqlclientlib
--without-mysqlclientlib
--with-socketlib
--without-socketlib
--with-mysqlclientlib
--without-mysqlclientlib
--with-nsllib
--without-nsllib
--with-mysqlclientlib
--without-mysqlclientlib
--with-mygcclib
--without-mygcclib
--with-mysqlclientlib
--without-mysqlclientlib


Gem files will remain installed in /var/lib/gems/1.8/gems/mysql-2.8.1
for inspection.
Results logged to /var/lib/gems/1.8/gems/mysql-2.8.1/ext/mysql_api/gem_make.out

Debian のバージョン落とせば...というのも1つの方法だと
思いますが、今回は新しくするついでに試してみた、という
だけなので...
--
-----------------------------------------------
Mayumi Nakamura
Reply all
Reply to author
Forward
0 new messages