【協力者募集】Shinsai Fax OCRプロジェクト

84 views
Skip to first unread message

gacha

unread,
Dec 27, 2011, 10:30:19 PM12/27/11
to Hack for Japan
はじめまして。
Shinsai Fax OCRプロジェクトの中河と申します。

国立保健医療科学院の奥村さんをプロジェクトリーダーとして、以前か
ら、震災対応にあたる多数の組織から効率的に情報を収集できるような
オープンソースのFaxOCRのシステムを開発しておりますが、開発者の人
手が足りず、なかなか苦労が続いております。

まずはこのシステムの概要、現在どこまで出来ていて、何が出来ていな
いのかを知って頂けるよう、簡単にまとめた2分弱の紹介ビデオを作成
しましたので、ご紹介させて頂きます。

http://www.youtube.com/watch?feature=player_embedded&v=3yXTSTYmews

ビデオでお示ししている通り、現状でも動作はするももの、可能であれ
ば、インターフェイスの改善やマニュアルの整備など、誰でも簡単に利
用が出来るシステムへと完成度を高めたいと考えており、Hack 4 Japan
の皆様のお力添えを頂きたく、プロジェクトの登録、MLでのお願いをさ
せて頂いてる次第です。具体的には、
- テスター
- マニュアル整備
- 開発者
 - ユーザインターフェイス系:Ruby on Rails / PHP
 - バックエンド系:LAMP
 - OCRモジュール:C / OpenCV / gocr
といった分野でのご協力を頂きたいと考えております。

震災から9ヶ月が経ちましたが、被災地支援における情報共有の非効率
はまだまだ現実的な課題です。たとえば、福島県内では、原発事故への
対応により生産者団体が独自で放射能を測定する試みが多数なされてい
ますが、こうした情報を効率的に集約する方法があるだけで、情報共有
は一気に効率化します。

このFaxOCRシステムを使いやすいシステムに作り上げ、現在の被災地支
援に役立てるとともに、来るべき災害への備えとなることを願っており
ます。

興味をお持ち下さった方は、まずは下記のプロジェクトサイトをご覧下
さい。参加表明、質問等、MLにて常時お待ちしております。

プロジェクトサイト : http://sites.google.com/site/faxocr2010/
プロジェクトML : fax...@googlegroups.com

どうか宜しくお願い申し上げます。

Masakazu Nakano

unread,
Jan 14, 2012, 12:09:15 PM1/14/12
to hack4...@googlegroups.com

なかのです

FBでメディアセンターをやってます
http://www.facebook.com/groups/mediacenterjp/

http://groups.google.com/group/faxocr?pli=1
へ取り急ぎ参加しました。

方方から伺っている話ですと、

まず

ファックス、コピー、プリンター、スキャナー

が足りておらず、VC間の意思疎通ができにくい状態がある

と聞いております。

その上で、率直な意見なのですが、

直近のOCR実現は難しい様に思います。

まずは、紙媒体をIP-FAX等で画像データ化し、

原稿及びデータ化の紐付けサーバを作り、

全国規模のボランティア(人力)でデータ起こしをする。

ところから始めた方がはやいような気がします。

急ぎであればadobeの純正PDFでスキャンデータから文字おこしが可能です。

また、オープンソースとしては、

asteriskとT.38(FAX over IP)系の話がほぼほぼ抜けているので、

検討してはいかがでしょうか?

ちなみに、IP回線上のFAX送受信は、

Quicknet LineJack and PhoneJack
http://www.highbeam.com/doc/1G1-55480802.html

とかありまして、99年頃からしばらく使ってましたが、案外枯れた技術です。

また、MicrosoftFAXもServerクラスには入っているハズで、

商用ソフトの追加でIP-FAXの送受信が可能です。

※IP-FAXとIP回線上(050)のFAXとは別物です。

なかの


--
なかの
http://andnow.co はじめました

kaz...@brain.imi.i.u-tokyo.ac.jp

unread,
Jan 15, 2012, 2:07:33 AM1/15/12
to hack4...@googlegroups.com
#加沢@CSVチーム ですが、まったく関係なく話をずらします。

むむむ? いまオフィスのFAXを別機種に変えているところで、古いFAXが
いらなくなるのですが、そういうのの受け入れ需要というのがあったりしますか?
(大学なので、声をかければ数ヶ月単位ならけっこう他にも出てきそうな気も・・
・)

--
Tomoki Kazawa
**************************************
〒153-8904 東京都目黒区駒場4丁目6番1号
東京大学 先端科学技術研究センター
神崎・高橋研究室 研究員
加沢 知毅  
Tel/Fax 03-5452-5197
E-mail: kaz...@brain.imi.i.u-tokyo.ac.jp
***************************************


Masakazu Nakano

unread,
Jan 15, 2012, 3:31:32 AM1/15/12
to hack4...@googlegroups.com
なかのです。

お、いいですね。

当方も今一度、現地の状況と窓口を確認してみますね。


--
なかの
http://andnow.co はじめました

Masakazu Nakano

unread,
Jan 15, 2012, 10:39:52 AM1/15/12
to hack4...@googlegroups.com

続 なかのです

スキャナ不足の解決には、

eFAXと言った公衆回線を利用する以外に、

一般的なFAX機器を擬似交換器(様はIP電話対応の内線が使える民生ルーターで
OKです)で繋ぎ、

数多のノートPCに無意味に内蔵されているであろうFAXMODEMに内線として入れてやる

手があります。

FAXはTIFF形式が主流ですので、ImagemagickかIrfan view等で一括変換すると良
いでしょう。

変換後をgdoc、Nドライブ、dropbox等に入れてやればOKです。


原稿の扱いですが、

youtubeのビデオにあるような定形
(視点を変えれば帳票処理です。これは20年前から業務用OCRで完全機械化され
ています)

と非定形が考えられ、一般的には非定形の方が流通量が多いハズです。

この辺りの精査を一度行ったほうがよいかもしれませんね。

なかの

(2011/12/28 12:30), gacha wrote:

Noritaka SHIMASAKA

unread,
Jan 15, 2012, 11:12:58 AM1/15/12
to hack4...@googlegroups.com, fax...@googlegroups.com
嶋坂@sinsai.infoです。
こんばんは。
#hack4jpのCSVチームかつ、FaxOCR PJ参加中です。

反応ありがとうございます。
やりとりがhack4jp MLのみで進んでいる様子なので、
FaxOCR ML側にも流しておきます。

実機のFaxの台数の問題という話もあるのですね…


2012年 1月 15日(日)4:07 pm に kaz...@brain.imi.i.u-tokyo.ac.jp さんは書き
ました:

以上よろしくお願いいたします。

--
by 嶋坂 紀隆
sinsai.info インフラ班/法務班
Mail: sh...@orca.gr.jp
Mail: aga...@sinsai.info

青木悟大

unread,
Jan 16, 2012, 11:32:20 PM1/16/12
to hack4...@googlegroups.com
皆様

こんにちは、青木と申します。

>実機のFaxの台数の問題という話もあるのですね…

Just Infoですが、FAXの寄贈プログラムを利用するという手段もあるかもしれません。
たとえば、下記は残念ながら1月前に締め切られていますが、年に何度か募集はあるようです。
 
   認定NPO法人イーパーツ
   http://www.eparts-jp.org/program/device/list.html

以上、ご参考までです~。

青木

2012年1月16日1:12 Noritaka SHIMASAKA <sh...@orca.gr.jp>:



--
┏┏┏┏━━━━━━━━━━━━━━━━━━━━━━━━
┏╋┏            
┏┏■   
┏      青木悟大 Aoki Godai 
┃       E-mail   :satohi...@gmail.com
┃       MOBILE:080-6007-9829
┃       SKYPE :aoki226
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━

Reply all
Reply to author
Forward
0 new messages