Groups
Sign in
Groups
faxocr
Conversations
About
Send feedback
Help
OCRエンジンのCNN対応について
29 views
Skip to first unread message
Takashi Okumura
unread,
Nov 9, 2016, 7:07:48 PM
11/9/16
Reply to author
Sign in to reply to author
Forward
Sign in to forward
Delete
You do not have permission to delete messages in this group
Copy link
Report message
Show original message
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to fax...@googlegroups.com
先日ご報告させて頂きましたOCRの性能向上に向けたCNN対応作業ですが、
関係各位のご尽力もあり、無事にfaxocrシステムに組み込むことが適いました。
モジュール性能でみてみると、下記の「現在の性能」欄にあるように、
当方の難読文字データセットを用いたベンチマークで、ベースラインが
71.9%だったものが、一気に97.6%に改善しました。これは、認識精度
コンテストに報告がある12件の中で、第2位に付ける性能です。(ちなみに、
第1位は、98.4%)
https://sites.google.com/site/faxocr2010/systemrequirements/kocr/mnist
ということで、もしご興味お持ち頂ければ、適宜お試し頂ければ幸いです。
バグレポートや高精度化、高速化のご提案、歓迎させて頂きます。
https://github.com/faxocr/kocr
奥村 貴史
2016-09-14 9:49 GMT+09:00 Takashi Okumura <
tao...@gmail.com
>:
>
> ご無沙汰致しております。
>
> FaxOCRシステム、継続的なメンテナンスに取り組んで来ましたが、
> OCRエンジンの性能向上が課題となっていました。そこで、今年の正月頃に、
> データセットを拡充したうえで手書き数字認証タスクの標準的なデータ形式
> であるMNIST形式での公開を行い、コンテスト形式で性能向上に取り組んで
> 頂いていました。その結果、何件もの結果報告を頂きまして、このたび、その
> うちの高性能をたたき出したCNN方式の分類器を、C++に移植して頂くこと
> が出来ました。
>
>
https://sites.google.com/site/faxocr2010/systemrequirements/kocr/mnist
>
https://github.com/faxocr/kocr/pulls
>
> 現在、頂いたpull requestの統合に向けた作業を進めています。
>
> 評価用・開発用システムのVMイメージを下記にて配布していますので、もし、
> ご興味をお持ち頂ければ適宜遊んで頂ければ幸いです。USBにコピーすれば
> そのまま立ち上がるはずです。USBが無ければ、vmware等でも動作するはず
> ですので、どうされポートも歓迎いたします。
>
>
https://sites.google.com/site/faxocr2010/ji-pc-de-tamesu
>
>
> 奥村 貴史
>
> 2016年5月24日火曜日 0時56分12秒 UTC+9 Takashi Okumura:
>>
>> 先日言及したOCRエンジンの性能向上作業ですが、正式に動き出しました。
>> また、rails4対応に向けて、github上で開発ブランチを切る方向になりました。
>>
>>
https://twitter.com/tweeting_drtaka/status/734750203668893696
>>
>> UIのさらなる改良等のテクニカルなタスクもありますが、テスターも必要ですし、
>> 広報改善も重要です。使ってみて頂いてその詳細なレポートをブログに書い
>> て頂くような形でも結構です。もし一部でもお願いできそうであれば、お気軽に
>> ご連絡ください。
>>
>> どうかよろしくお願い申し上げます。
>>
>>
>> 奥村 貴史
>>
>> > OCRエンジンとしての単純な認識性能ですが、faxocrが利用しているKOCR
>> > の認識精度については、下記で情報公開しています。現在、USBブートで利用
>> > できるVMイメージ内のocrエンジンは精度が低い(独自の難読字データセットで
>> > 71.9%)ですが、開発中コードは92.0%と大幅に性能向上しています。さらに、
>> > 公開したデータを用いたコンテストでは、CNNを用いて98.4%まで出ており、
>> > 現在、そのモデルの移植作業を準備しています。
>
> --
> このメールは Google グループのグループ「faxocr」に登録しているユーザーに送られています。
> このグループから退会し、グループからのメールの配信を停止するには
faxocr+un...@googlegroups.com
> にメールを送信してください。
> その他のオプションについては
https://groups.google.com/d/optout
にアクセスしてください。
Reply all
Reply to author
Forward
0 new messages