メジャーアップデートについて

16 views
Skip to first unread message

Takashi Okumura

unread,
May 23, 2016, 11:56:12 AM5/23/16
to fax...@googlegroups.com
先日言及したOCRエンジンの性能向上作業ですが、正式に動き出しました。
また、rails4対応に向けて、github上で開発ブランチを切る方向になりました。

https://twitter.com/tweeting_drtaka/status/734750203668893696

UIのさらなる改良等のテクニカルなタスクもありますが、テスターも必要ですし、
広報改善も重要です。使ってみて頂いてその詳細なレポートをブログに書い
て頂くような形でも結構です。もし一部でもお願いできそうであれば、お気軽に
ご連絡ください。

どうかよろしくお願い申し上げます。


奥村 貴史

> OCRエンジンとしての単純な認識性能ですが、faxocrが利用しているKOCR
> の認識精度については、下記で情報公開しています。現在、USBブートで利用
> できるVMイメージ内のocrエンジンは精度が低い(独自の難読字データセットで
> 71.9%)ですが、開発中コードは92.0%と大幅に性能向上しています。さらに、
> 公開したデータを用いたコンテストでは、CNNを用いて98.4%まで出ており、
> 現在、そのモデルの移植作業を準備しています。

Takashi Okumura

unread,
Sep 13, 2016, 8:49:51 PM9/13/16
to faxocr, ta...@wide.ad.jp

ご無沙汰致しております。

FaxOCRシステム、継続的なメンテナンスに取り組んで来ましたが、
OCRエンジンの性能向上が課題となっていました。そこで、今年の正月頃に、
データセットを拡充したうえで手書き数字認証タスクの標準的なデータ形式
であるMNIST形式での公開を行い、コンテスト形式で性能向上に取り組んで
頂いていました。その結果、何件もの結果報告を頂きまして、このたび、その
うちの高性能をたたき出したCNN方式の分類器を、C++に移植して頂くこと
が出来ました。


現在、頂いたpull requestの統合に向けた作業を進めています。

評価用・開発用システムのVMイメージを下記にて配布していますので、もし、
ご興味をお持ち頂ければ適宜遊んで頂ければ幸いです。USBにコピーすれば
そのまま立ち上がるはずです。USBが無ければ、vmware等でも動作するはず
ですので、どうされポートも歓迎いたします。



奥村 貴史

2016年5月24日火曜日 0時56分12秒 UTC+9 Takashi Okumura:
Reply all
Reply to author
Forward
0 new messages