【メジャーバージョンアップ作業】テスター、リリース作業支援のお願い

49 views
Skip to first unread message

Takashi Okumura

unread,
Aug 1, 2020, 2:52:11 AM8/1/20
to faxocr
お世話となっております。

FaxOCRにさまざまなコードのcontributionを頂いていましたが、
システムが前提しているライブラリ等が古く、コードの統合と
今後の開発環境の基盤を整える作業が必要になっていしました。
その困難な作業を、今回、竹内さんがすべて整理して下さり、
ようやく最新の開発版を共有できるところまで辿り着きました
のでご報告させて頂きます。竹内さん、誠に有難うございました。

今回はmajor revisionですので、安定化のためにも多くのテスト
が必要です。そこで、協力して下さる方を募集するためメールを
お送り致しました。いくつかの環境で直ぐに試せるVMもご用意
頂きましたので、もしご興味をお持ち頂ければ、ぜひお力をお
借りできれば幸いです。

* VM環境について

raw、vmdk、vdiを用意させて頂きました。rawは、dd等でUSBメモ
リに書き出して頂ければブートできるはずです。vmdkを利用するの
は、VMware (player)で適当なVMを作ったうえで、HDDを削除し、
このvmdkイメージをSCSIディスク等としてマウントすれば動きます。
vdiは、動作確認していませんが、virtual boxで試してみて頂ければ
幸いです。(レポート歓迎致します)

** rawフォーマット (展開後サイズ 16G)
 faxocr-develop4-20200730.raw.zip (3.4G)
 https://drive.google.com/file/d/1ZpP61_8c1R6yXlhMsDpC-Z_6NbvbuCKv/view?usp=sharing

** vmdkフォーマット (展開後サイズ 8.5G)
 faxocr-develop4-20200730.vmdk.zip (3.4G)
 https://drive.google.com/file/d/14IHszKRRWyyOfr5k2liNLUrbGcx_nSvR/view?usp=sharing

** vdiフォーマット (展開後サイズ 9.3G)
 faxocr-develop4-20200730.vdi.zip (3.4G)
 https://drive.google.com/file/d/1h5QvXoR-K4v1ePMdSzdkVeysC6LkFfx9/view?usp=sharing

テストは、手順を定めているわけでないため、あれこれいじくってみたり、
添付のexcelファイルからファックス送信用のPDFを作成してみたり、
お願いできれば幸いです。実際にFaxを送受信してのテストを引き受けて
下さる方がおられれば、ファックスサーバのアカウントをお貸しすることも
できますので、ご一報頂ければ幸いです。マニュアルは、下記をご参照
下さい。マニュアルをより充実させるためのボランティアも歓迎します。

 https://sites.google.com/site/faxocr2010/service

また、もし宜しければ、動かした際の感想を、些細なものでも結構ですので、
お知らせ頂ければ幸いです。自分で動かしてみたところでは、デフォルトの
画面解像度が800x600であることで、VM内で動かすブラウザがシステムの
web画面を完全に表示できない点が気になりました。また、今から思えば、
デスクトップにFaxOCRのアイコンが置いてあるほうが親切かも知れません。
下記に自由に書き込める場所を置いておきましたので、匿名でのご意見も
歓迎します。

 https://docs.google.com/document/d/10_Ph0XreTydHatGlWYPz6r8grswvyB7VZGXSXRvJqYE/edit

* 開発環境について

次に、開発やデバッグに関しての情報です。今回、Fax OCRに関わる
各種サブシステム毎に、最新コードの開発用ブランチを整理して
頂きました。RoRで構築されているFaxOCRそのものは「develop-4」、
ファックスされたシートを読み取るsheetreaderに「develop」、
OCRエンジンであるkocrに「develop」のブランチを、それぞれ
設定してあります。

 https://github.com/faxocr/faxocr
 https://github.com/faxocr/sheet-reader
 https://github.com/faxocr/kocr

依存しているライブラリのバージョンも、一通り上げて頂いています。
ただ、それぞれ手作業でインストールして頂くのは大変です。コード
をいじる方法としては、上記のVMイメージ内部で作業をして頂くのが
最短です。ただし、その場合、GPUでの学習ができない可能性があり
ます(特に、VM ware)。この問題への対策として、VMイメージと等価
な環境を実現できるdocker imageがありますので、そちらを活用頂け
れば幸いです。

docker run -itd --name my-faxocr-allinone -p 80:80 -p 25:25 -p
3000:3000 sohgo/faxocr-allinone:develop-4
https://hub.docker.com/repository/docker/sohgo/faxocr-allinone/general

こちらのdockerイメージへのcontributionも、歓迎させて頂きます。

Fax OCRシステム、UIデザイン自体が2011年に行ったままで、中々
レガシー感も出てきましたので、この機会にデザイン自体を少し
updateして頂くような貢献も歓迎致します。再利用も自由なオープン
ソースですので、自由に活用頂ければ幸いです。

どうかよろしくお願い申し上げます。


奥村 貴史
テスト用excelファイル集-2020.zip

Shigeru Shiozawa

unread,
Aug 2, 2020, 9:45:42 PM8/2/20
to faxocr
奥村先生、竹内様

お世話になっております。

各種モジュールのバージョンアップありがとうございます。
1点、下記のモジュールについて確認させてください。

このモジュールが使用するpythonのバージョンは2ですが、3にアップする予定はございますでしょうか?
python2は、2020年1月でサポート終了となっております。

別件で、弊社側の山本(y...@zenryokukikai.com)アカウントのGoogleGroups権限が外れてしまいまいました。
山本から申請をさせて頂いておりますので、お手隙の際に承認をお願い出来ますと助かります。

以上、よろしくお願いいたします。

塩澤

2020年8月1日土曜日 15:52:11 UTC+9 Takashi Okumura:

Takashi Okumura

unread,
Aug 2, 2020, 9:57:51 PM8/2/20
to faxocr
コメントありがとうございました。

> https://github.com/faxocr/kocr
> このモジュールが使用するpythonのバージョンは2ですが、3に
> アップする予定はございますでしょうか?
> python2は、2020年1月でサポート終了となっております。

必要は認識しているものの、特に動いてはいないと理解しています。

本システムにおいてpythonに依存しているのは学習部分だけのはず
で、バージョンアップ等の影響は限局されているはずです。
developブランチが整理され、さまざまなコードが統合された
状況ですので、バージョンアップして頂ければ有難いところです。


奥村 貴史
> --
> このメールは Google グループのグループ「faxocr」に登録しているユーザーに送られています。
> このグループから退会し、グループからのメールの配信を停止するには faxocr+un...@googlegroups.com にメールを送信してください。
> このディスカッションをウェブ上で閲覧するには https://groups.google.com/d/msgid/faxocr/d81ae846-8498-405d-9d08-1f207c381223n%40googlegroups.com にアクセスしてください。

Shigeru Shiozawa

unread,
Aug 2, 2020, 11:05:10 PM8/2/20
to faxocr
奥村先生
さっそくのご回答ありがとうございました。

それでは、弊社側で担当させて頂いている学習環境においては、python3を利用しモデルを作成させて頂ければと思います。
弊社側の最新ソースを新リポジトリへのpull requestが準備できましたら、共有をさせて頂ければと思います。

山本アカウントへの承認ありがとうございました!

どうぞ、宜しくお願い致します。

塩澤  

2020年8月3日月曜日 10:57:51 UTC+9 Takashi Okumura:

kekekekenta

unread,
Nov 7, 2020, 3:15:21 AM11/7/20
to faxocr
今までのコードを確認した上で、細かい修正を加えてタグを付けました。

また、次のバージョンでは、以下の内容を解決するためにTensorflow Kerasで動かすことを考えていきたいです。
・Keras(Theanoバックエンド)で学習しているため、最新のGPU機能を使うことが難しい
・新しいネットワークに対応する作業コストが大きい

青木

2020年8月3日月曜日 12:05:10 UTC+9 Shigeru Shiozawa:

Takashi Okumura

unread,
Nov 7, 2020, 9:13:40 AM11/7/20
to faxocr
有難うございました。大変助かりました。

なお、現在生じている新型コロナパンデミックへの対応として、
本システムが活用される可能性が高まっているのですけれども、
新コードをテストするとして、どういうやり方が良いでしょう。

よろしければ、アイディア等頂ければ助かります。>各位
ファックスサーバは、供出できますので。。。

ご検討頂ければ幸いです。
どうか宜しくお願い申し上げます。


奥村 貴史
> このディスカッションをウェブ上で閲覧するには https://groups.google.com/d/msgid/faxocr/15f4db87-5689-4f5b-b2c0-95cfb5077313n%40googlegroups.com にアクセスしてください。
Reply all
Reply to author
Forward
0 new messages