ご協力のお願い 認識精度向上作戦

13 views
Skip to first unread message

Mayumi Nakamura

unread,
Feb 22, 2012, 3:48:54 AM2/22/12
to fax...@googlegroups.com
先日来・・・
FAXされた文字データの読み取り精度向上のため、
ドライバの改造であったり、色々進められておりますが、
人間と同様、FaxOCRのシステムにも、より多くの経験
をさせると、精度があがるような仕組みになっております。

つきましては、本MLにご登録いただいている皆様に、
先生になっていただいて、FaxOCRに、教えてあげて
いただけませんでしょうか。

教え方は簡単です。

本メールに添付のPDFファイルを印刷して、0 ~ 9,
○△× を、ご記入いただき、記載のFAX番号へ送信いた
だくだけです。
記入欄が2段ありますが、それぞれ異なる種類の筆記具
で、ご記入いただけると、お勉強の幅が広がり、大変よろ
こびます。。

お送りいただいたデータは、現在稼動している
FaxOCR サーバが受け取ります。
(デモ環境などを提供している環境が受信します。)

お名前、ご連絡先等は不要ですし、受信したシステム
からも、それらを知る術はありませんので、
(できればお友達等お誘いあわせのうえ)
お気軽にご協力いただけますと幸いです。
(個人情報保護法には、本件は抵触しません。)

どうぞよろしくお願いいたします。

sheet-ocr.pdf

OSWS 永原 篤

unread,
Feb 22, 2012, 8:14:52 AM2/22/12
to fax...@googlegroups.com
こんにちわ。
(株)オープンソース・ワークショップの永原です。

僕と嫁さんの2人分、送りました。
ほとんどお手伝いできていないので、せめてこれぐらいと思いまして。

以上です。

-------------------------------------------------------------
株式会社 オープンソース・ワークショップ
永原 篤
e-mail naga...@opensource-workshop.jp
url http://opensource-workshop.jp
twitter http://twitter.com/nagasheep
携帯 090(1699)2746
-------------------------------------------------------------

ファーストサーバのNetCommons for ASPなら、月額 8,925円でNetCommons!
http://www.fsv.jp/cloudap/service/netcom.html

PHP技術の習得度合いを測るには、PHP技術者認定試験
http://www.phpexam.jp/

NetCommonsでビジネスをお考えなら!NPO法人コモンズネット
http://www.commonsnet.org/

オープンソース・ビジネスを推進するOSSコンソーシアム
http://osscons.jp/

商用利用可能なフリー写真素材、花・昆虫・地球が人気です。
http://hitsuji.atnifty.com
-------------------------------------------------------------

Mayumi Nakamura

unread,
Feb 22, 2012, 9:42:32 AM2/22/12
to fax...@googlegroups.com
永原さん、

早速のご協力、ありがとうございます!
確認してみたところ、ちゃんと届いていました!

そして、大事なことをお伝えし忘れていたことに気付きました。

このシステム、1送信あたり、1枚を読み取ります。

FAX送信自体は、2枚、3枚一緒に送信いただいても、問題なく
送信できて、エラーにもならないのですが、FaxOCRのシステム
が受け取った際に、先頭の1枚だけ読みとります。

というわけでせっかくお送りくださったのに、1枚だけしか解析でき
ておらず・・・大変申し訳ありません。

これも開発途上の1step と、ご容赦いただけますとありがたく存じます。


また、コンビニエンスストアのFAXサービスを利用される場合には、
サービスの仕様をあらかじめご確認のうえ、ご利用ください。

「よくある質問」にも掲載させていただいておりますが、
https://sites.google.com/site/faxocr2010/faq

FAXサービスの仕様により、今回FAX番号として指定している
050 を使用する番号宛に送信できない、ことが確認されております。

諸々お手数をおかけいたしますが、より多くの皆様のご協力を
いただけますと、助かります。

どうぞよろしくお願いいたします。

2012/2/22 OSWS 永原 篤 <naga...@opensource-workshop.jp>:

OSWS 永原 篤

unread,
Feb 22, 2012, 9:53:59 AM2/22/12
to fax...@googlegroups.com
永原です。

>このシステム、1送信あたり、1枚を読み取ります。

おおっ。
試してみるものですね。(^^)

せっかくなので、再度送りました。
今度は1枚ずつ、2回です。
どっちが届いたかわからなかったので、申し訳ありませんが
両方、送らせて頂きました。

また、ウチはひかり電話なので050 はダメかな?とか
思いながら送ったのですが、届いてよかったです。

Masakazu Nakano

unread,
Feb 22, 2012, 10:09:49 AM2/22/12
to fax...@googlegroups.com

なかのです

一般的にFAXは僕みたいないい加減な人間以外は、

第1ページに送り状をつける事が通例なので、

複数ページのバッチ処理

を考慮しておく必要があります。

また、一般的な家庭用民生向けFAXはADFの構造上、

複数ページ目は原稿が曲がる可能性が高いです。

なかの

# 050回線でのFAXは、
# FAX本体の設定を コクサイ モードにしておくと確立が到達率があがるかも
しれません。


--
なかの
http://andnow.co はじめました

Mayumi Nakamura

unread,
Feb 22, 2012, 10:15:37 AM2/22/12
to fax...@googlegroups.com
重ねてのご協力、ありがとうございます!
お手数おかけしてすみません。

2つとも無事到着しておりました。

そして、ひかり電話からの送信がOK、という、
新たな情報も知ることができました。
(ひかり電話・・・今はメタル線以外にも乗っているのですよね)

本当にありがとうございました!

--
-----------------------------------------------
Mayumi Nakamura

Mayumi Nakamura

unread,
Feb 22, 2012, 10:09:19 PM2/22/12
to fax...@googlegroups.com
中村です。

送付状の件に関しては、ある程度運用で解決できるかもしれませんね。

このシステム自体、不特定多数の方から、何でもアリなユニークな
データ(FAX)を受け付けるものではなく、シナリオ(調査事項)に沿って、
メンバーを登録し、報告をあげてもらう、というスタイルだと思います
ので、「送付状不要」をシナリオで宣言し、必要な事項があれば、報告
用シートに反映させることも可能かと思います。

また、コンビニFAX における 050番号の件に関しては、コンビニエンス
ストアチェーン数社が同じサービスプラットフォームを採用しており、
その採用しているサービスプラットフォーム自体が、050番号宛の送信
に対応していない(いわばサービス網側仕様)、なので、個別の機器
本体の操作での解決は難しいと思われます。
(2011年11月現在、各社Webサイト掲載情報の調査結果なので、
 その後改善されているかもしれませんが・・・。)


2012/2/23 Masakazu Nakano <empla...@gmail.com>:

--
-----------------------------------------------
Mayumi Nakamura

Masakazu Nakano

unread,
Feb 23, 2012, 12:46:12 AM2/23/12
to fax...@googlegroups.com

なかのです

習慣ってヤツはなかなか…

で、extract multi page tiff でググってみたら、こんなのが :-)
http://www.rgagnon.com/javadetails/java-0535.html

http://tiffsplitter.org/

http://svn.icmb.utexas.edu/svn/repository/trunk/zpub/sdkpub/freeimage/Wrapper/FreeImagePlus/test/fipTestMPage.cpp

なかの


--
なかの
http://andnow.co はじめました

Takashi Okumura

unread,
Feb 23, 2012, 3:46:59 AM2/23/12
to fax...@googlegroups.com
情報提供、ありがとうございました。

既にパッケージを利用しているImageMagickに、convertという
ツールがあって、どうもこれでうまくいきそうです。

debian-faxocr:~/tifs> ls -alt
合計 84
drwxr-xr-x 2 taka taka 4096 2012-02-20 05:27 ./
-rw-r--r-- 1 taka taka 72532 2012-02-20 05:04 multi.tif
drwxr-xr-x 22 taka taka 4096 2012-02-20 04:46 ../
debian-faxocr:~/tifs> convert multi.tif single%d.tif
debian-faxocr:~/tifs> ls -alt
合計 156
drwxr-xr-x 2 taka taka 4096 2012-02-20 05:28 ./
-rw-r--r-- 1 taka taka 36140 2012-02-20 05:28 single0.tif
-rw-r--r-- 1 taka taka 36256 2012-02-20 05:28 single1.tif
-rw-r--r-- 1 taka taka 72532 2012-02-20 05:04 multi.tif
drwxr-xr-x 22 taka taka 4096 2012-02-20 04:46 ../

実際に動かすところまでするには、もうすこしお時間を頂ければ。。。


奥村 貴史

2012/2/23 Masakazu Nakano <empla...@gmail.com>:
>
> なかのです
>

Masakazu Nakano

unread,
Feb 23, 2012, 6:42:29 PM2/23/12
to fax...@googlegroups.com

convert で OKでしたか :-)

となると、ライブラリ選びはメンテナーと処理速度によりけりですかね。

分散処理がどうのこうのってどっかで読んだ気もするので、

ImageMagick で困らないかもしれませんね。

なかの

Masakazu Nakano

unread,
Feb 23, 2012, 6:44:18 PM2/23/12
to fax...@googlegroups.com

convert で OKでしたか :-)

となると、ライブラリ選びはメンテナーと処理速度によりけりですかね。

分散処理がどうのこうのってどっかで読んだ気もするので、

ImageMagick で困らないかもしれませんね。

なかの

(2012/02/23 17:46), Takashi Okumura wrote:

Masakazu Nakano

unread,
Mar 9, 2012, 9:44:14 AM3/9/12
to fax...@googlegroups.com

なかのです

ちょっと趣旨がずれてしまうかも知れないのですが、

ちょっとしたアイデアがありまして、

一部を商用にforkしたいと考えているのですが、

統括サイドとしては、感触的にいかがでしょうか?

あまり気分の良いものではない

という事であれば、

昔、手をつけていた物を改良する事にしたいと思います。

ご意見いただければ幸いです。

仕様としては、

I/Fに EICON社製 DIVA ISDN 4BRI PCIカード
h/w 中古PC
s/w asterisk 及び fax関連ソフト
http://appsv.ocrgrid.org/nhocr/index-j.html

辺りで仮組みしてみます…

なかの

(2012/02/23 17:46), Takashi Okumura wrote:

Reply all
Reply to author
Forward
0 new messages