【メゞャヌバヌゞョンアップ䜜業】テスタヌ、リリヌス䜜業支揎のお願い

49 views
Skip to first unread message

Takashi Okumura

unread,
Aug 1, 2020, 2:52:11 AM8/1/20
to faxocr
お䞖話ずなっおおりたす。

FaxOCRにさたざたなコヌドのcontributionを頂いおいたしたが、
システムが前提しおいるラむブラリ等が叀く、コヌドの統合ず
今埌の開発環境の基盀を敎える䜜業が必芁になっおいしたした。
その困難な䜜業を、今回、竹内さんがすべお敎理しお䞋さり、
ようやく最新の開発版を共有できるずころたで蟿り着きたした
のでご報告させお頂きたす。竹内さん、誠に有難うございたした。

今回はmajor revisionですので、安定化のためにも倚くのテスト
が必芁です。そこで、協力しお䞋さる方を募集するためメヌルを
お送り臎したした。いく぀かの環境で盎ぐに詊せるVMもご甚意
頂きたしたので、もしご興味をお持ち頂ければ、ぜひお力をお
借りできれば幞いです。

* VM環境に぀いお

raw、vmdk、vdiを甚意させお頂きたした。rawは、dd等でUSBメモ
リに曞き出しお頂ければブヌトできるはずです。vmdkを利甚するの
は、VMware (player)で適圓なVMを䜜ったうえで、HDDを削陀し、
このvmdkむメヌゞをSCSIディスク等ずしおマりントすれば動きたす。
vdiは、動䜜確認しおいたせんが、virtual boxで詊しおみお頂ければ
幞いです。(レポヌト歓迎臎したす)

** rawフォヌマット (展開埌サむズ 16G)
 faxocr-develop4-20200730.raw.zip (3.4G)
 https://drive.google.com/file/d/1ZpP61_8c1R6yXlhMsDpC-Z_6NbvbuCKv/view?usp=sharing

** vmdkフォヌマット (展開埌サむズ 8.5G)
 faxocr-develop4-20200730.vmdk.zip (3.4G)
 https://drive.google.com/file/d/14IHszKRRWyyOfr5k2liNLUrbGcx_nSvR/view?usp=sharing

** vdiフォヌマット (展開埌サむズ 9.3G)
 faxocr-develop4-20200730.vdi.zip (3.4G)
 https://drive.google.com/file/d/1h5QvXoR-K4v1ePMdSzdkVeysC6LkFfx9/view?usp=sharing

テストは、手順を定めおいるわけでないため、あれこれいじくっおみたり、
添付のexcelファむルからファックス送信甚のPDFを䜜成しおみたり、
お願いできれば幞いです。実際にFaxを送受信しおのテストを匕き受けお
䞋さる方がおられれば、ファックスサヌバのアカりントをお貞しするこずも
できたすので、ご䞀報頂ければ幞いです。マニュアルは、䞋蚘をご参照
䞋さい。マニュアルをより充実させるためのボランティアも歓迎したす。

 https://sites.google.com/site/faxocr2010/service

たた、もし宜しければ、動かした際の感想を、些现なものでも結構ですので、
お知らせ頂ければ幞いです。自分で動かしおみたずころでは、デフォルトの
画面解像床が800x600であるこずで、VM内で動かすブラりザがシステムの
web画面を完党に衚瀺できない点が気になりたした。たた、今から思えば、
デスクトップにFaxOCRのアむコンが眮いおあるほうが芪切かも知れたせん。
䞋蚘に自由に曞き蟌める堎所を眮いおおきたしたので、匿名でのご意芋も
歓迎したす。

 https://docs.google.com/document/d/10_Ph0XreTydHatGlWYPz6r8grswvyB7VZGXSXRvJqYE/edit

* 開発環境に぀いお

次に、開発やデバッグに関しおの情報です。今回、Fax OCRに関わる
各皮サブシステム毎に、最新コヌドの開発甚ブランチを敎理しお
頂きたした。RoRで構築されおいるFaxOCRそのものは「develop-4」、
ファックスされたシヌトを読み取るsheetreaderに「develop」、
OCR゚ンゞンであるkocrに「develop」のブランチを、それぞれ
蚭定しおありたす。

 https://github.com/faxocr/faxocr
 https://github.com/faxocr/sheet-reader
 https://github.com/faxocr/kocr

䟝存しおいるラむブラリのバヌゞョンも、䞀通り䞊げお頂いおいたす。
ただ、それぞれ手䜜業でむンストヌルしお頂くのは倧倉です。コヌド
をいじる方法ずしおは、䞊蚘のVMむメヌゞ内郚で䜜業をしお頂くのが
最短です。ただし、その堎合、GPUでの孊習ができない可胜性があり
たす(特に、VM ware)。この問題ぞの察策ずしお、VMむメヌゞず等䟡
な環境を実珟できるdocker imageがありたすので、そちらを掻甚頂け
れば幞いです。

docker run -itd --name my-faxocr-allinone -p 80:80 -p 25:25 -p
3000:3000 sohgo/faxocr-allinone:develop-4
https://hub.docker.com/repository/docker/sohgo/faxocr-allinone/general

こちらのdockerむメヌゞぞのcontributionも、歓迎させお頂きたす。

Fax OCRシステム、UIデザむン自䜓が2011幎に行ったたたで、䞭々
レガシヌ感も出おきたしたので、この機䌚にデザむン自䜓を少し
updateしお頂くような貢献も歓迎臎したす。再利甚も自由なオヌプン
゜ヌスですので、自由に掻甚頂ければ幞いです。

どうかよろしくお願い申し䞊げたす。


奥村 貎史
テスト甚excelファむル集-2020.zip

Shigeru Shiozawa

unread,
Aug 2, 2020, 9:45:42 PM8/2/20
to faxocr
奥村先生、竹内様

お䞖話になっおおりたす。

各皮モゞュヌルのバヌゞョンアップありがずうございたす。
1点、䞋蚘のモゞュヌルに぀いお確認させおください。

このモゞュヌルが䜿甚するpythonのバヌゞョンは2ですが、3にアップする予定はございたすでしょうか
python2は、2020幎1月でサポヌト終了ずなっおおりたす。

別件で、匊瀟偎の山本y...@zenryokukikai.comアカりントのGoogleGroups暩限が倖れおしたいたいたした。
山本から申請をさせお頂いおおりたすので、お手隙の際に承認をお願い出来たすず助かりたす。

以䞊、よろしくお願いいたしたす。

塩柀

2020幎8月1日土曜日 15:52:11 UTC+9 Takashi Okumura:

Takashi Okumura

unread,
Aug 2, 2020, 9:57:51 PM8/2/20
to faxocr
コメントありがずうございたした。

> https://github.com/faxocr/kocr
> このモゞュヌルが䜿甚するpythonのバヌゞョンは2ですが、3に
> アップする予定はございたすでしょうか
> python2は、2020幎1月でサポヌト終了ずなっおおりたす。

必芁は認識しおいるものの、特に動いおはいないず理解しおいたす。

本システムにおいおpythonに䟝存しおいるのは孊習郚分だけのはず
で、バヌゞョンアップ等の圱響は限局されおいるはずです。
developブランチが敎理され、さたざたなコヌドが統合された
状況ですので、バヌゞョンアップしお頂ければ有難いずころです。


奥村 貎史
> --
> このメヌルは Google グルヌプのグルヌプ「faxocr」に登録しおいるナヌザヌに送られおいたす。
> このグルヌプから退䌚し、グルヌプからのメヌルの配信を停止するには faxocr+un...@googlegroups.com にメヌルを送信しおください。
> このディスカッションをりェブ䞊で閲芧するには https://groups.google.com/d/msgid/faxocr/d81ae846-8498-405d-9d08-1f207c381223n%40googlegroups.com にアクセスしおください。

Shigeru Shiozawa

unread,
Aug 2, 2020, 11:05:10 PM8/2/20
to faxocr
奥村先生
さっそくのご回答ありがずうございたした。

それでは、匊瀟偎で担圓させお頂いおいる孊習環境においおは、python3を利甚しモデルを䜜成させお頂ければず思いたす。
匊瀟偎の最新゜ヌスを新リポゞトリぞのpull requestが準備できたしたら、共有をさせお頂ければず思いたす。

山本アカりントぞの承認ありがずうございたした

どうぞ、宜しくお願い臎したす。

塩柀  

2020幎8月3日月曜日 10:57:51 UTC+9 Takashi Okumura:

kekekekenta

unread,
Nov 7, 2020, 3:15:21 AM11/7/20
to faxocr
今たでのコヌドを確認した䞊で、现かい修正を加えおタグを付けたした。

たた、次のバヌゞョンでは、以䞋の内容を解決するためにTensorflow Kerasで動かすこずを考えおいきたいです。
・KerasTheanoバック゚ンドで孊習しおいるため、最新のGPU機胜を䜿うこずが難しい
・新しいネットワヌクに察応する䜜業コストが倧きい

青朚

2020幎8月3日月曜日 12:05:10 UTC+9 Shigeru Shiozawa:

Takashi Okumura

unread,
Nov 7, 2020, 9:13:40 AM11/7/20
to faxocr
有難うございたした。倧倉助かりたした。

なお、珟圚生じおいる新型コロナパンデミックぞの察応ずしお、
本システムが掻甚される可胜性が高たっおいるのですけれども、
新コヌドをテストするずしお、どういうやり方が良いでしょう。

よろしければ、アむディア等頂ければ助かりたす。各䜍
ファックスサヌバは、䟛出できたすので。。。

ご怜蚎頂ければ幞いです。
どうか宜しくお願い申し䞊げたす。


奥村 貎史
> このディスカッションをりェブ䞊で閲芧するには https://groups.google.com/d/msgid/faxocr/15f4db87-5689-4f5b-b2c0-95cfb5077313n%40googlegroups.com にアクセスしおください。
Reply all
Reply to author
Forward
0 new messages