先日言及したOCRエンジンの性能向上作業ですが、正式に動き出しました。
また、rails4対応に向けて、github上で開発ブランチを切る方向になりました。
https://twitter.com/tweeting_drtaka/status/734750203668893696
UIのさらなる改良等のテクニカルなタスクもありますが、テスターも必要ですし、
広報改善も重要です。使ってみて頂いてその詳細なレポートをブログに書い
て頂くような形でも結構です。もし一部でもお願いできそうであれば、お気軽に
ご連絡ください。
どうかよろしくお願い申し上げます。
奥村 貴史
> OCRエンジンとしての単純な認識性能ですが、faxocrが利用しているKOCR
> の認識精度については、下記で情報公開しています。現在、USBブートで利用
> できるVMイメージ内のocrエンジンは精度が低い(独自の難読字データセットで
> 71.9%)ですが、開発中コードは92.0%と大幅に性能向上しています。さらに、
> 公開したデータを用いたコンテストでは、CNNを用いて98.4%まで出ており、
> 現在、そのモデルの移植作業を準備しています。