画像からのテキスト認識(OCR)の方法

4,424 views
Skip to first unread message

ほのかパパ

unread,
May 20, 2011, 12:08:34 AM5/20/11
to 日本Androidの会
はじめまして。
ほのかパパと申します。

android初心者で本を購入し勉強中です。
名刺からテキストを認識しているアプリ(Bizcaroid liteなど)に興味があり
自分でも画像からのテキスト認識をしてみたいと思っています。
しかし、いろいろOCRについて調べているのですが・・・ググリベタ(・・;)

どなたか方法、参考本などあればご教授願います。

ちなみに、茨城県在住なのですが茨城の方はいますか?
茨城支部などは今後できるのでしょうか?

bina

unread,
May 20, 2011, 3:34:37 AM5/20/11
to 日本Androidの会
ほのかパパさん

はじめまして。binaといいます。
OCRについて軽く調べたところ、
TesseractというGoogle製のOCRエンジンというものがあるようです。
調べてみてはいかがでしょうか?

参考ページ
http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html

ほのかパパ

unread,
May 20, 2011, 4:48:31 AM5/20/11
to 日本Androidの会
binaさん

早速の情報ありがとうございます。
英語のページで不安ですが、日本語で変換して解読してみます。
日本語にしても理解できるかどうか・・・ (・・;)



On 5月20日, 午後4:34, bina <akas...@gmail.com> wrote:
> ほのかパパさん
>
> はじめまして。binaといいます。
> OCRについて軽く調べたところ、
> TesseractというGoogle製のOCRエンジンというものがあるようです。
> 調べてみてはいかがでしょうか?
>
> 参考ページhttp://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesse...

大垣憲俊

unread,
May 21, 2011, 10:06:25 AM5/21/11
to android-g...@googlegroups.com
パパさん

大垣です。

>自分でも画像からのテキスト認識をしてみたいと思っています。 
>どなたか方法、参考本などあればご教授願います。 

もし簡単な方法をお探しということであれば、sourceforge.jp「ocr」を
キーワードに検索されると出てきます。
(動作は保証できません...)



しかし、まず原理を知りたいというのであれば、以下の書籍をおすすめします。
(私も持っていますが「わかりやすい」かどうかは...)

「わかりやすいパターン認識」
ISBN-10: 4274131491
ISBN-13: 978-4274131493


Rabbit-U

unread,
May 22, 2011, 8:44:21 AM5/22/11
to 日本Androidの会
群馬支部のRabbit-Uです。

つくば市も茨城県ですよね?つくば市の人には東京で合ったことがあります(^-^)>
タイトルに「茨城」を入れないと目に付かないかもしれないですね。

On 5月20日, 午後1:08, ほのかパパ <yo.on.the.bo...@gmail.com> wrote:

ほのかパパ

unread,
May 22, 2011, 7:52:58 PM5/22/11
to 日本Androidの会
大垣さん

> しかし、まず原理を知りたいというのであれば、以下の書籍をおすすめします。
> (私も持っていますが「わかりやすい」かどうかは...)
>
> 「わかりやすいパターン認識」
> ISBN-10: 4274131491
> ISBN-13: 978-4274131493

原理を知りたかったです。ありがとうございます。
理解できるかどうかは・・・
購入してみます。

ほのかパパ

unread,
May 22, 2011, 7:59:10 PM5/22/11
to 日本Androidの会
Rabbit-Uさん

> つくば市も茨城県ですよね?つくば市の人には東京で合ったことがあります(^-^)>

まさしくつくば市在住です。やはり東京へ行ってるのですね。

> タイトルに「茨城」を入れないと目に付かないかもしれないですね。

そうですよね(^^;)ぜんぜん内容が違うので茨城の人がみるとは限らないですね。

MIWA Yoshiko

unread,
May 22, 2011, 8:45:45 PM5/22/11
to android-g...@googlegroups.com
三輪です。

東京在住ですが、月に1~4回はつくば市に行っていますよ。週に3日ほど毎週滞在していた時期も。
筑波大の大学院に在学しているからですが、学業は全然進まず、経路にあるスーパーの特売の傾向と対策にやたら詳しくなりました。
行くと必ず買ってくるのは、干し納豆です。

2011年5月23日8:59 ほのかパパ <yo.on.t...@gmail.com>:

> --
> このメールは Google グループのグループ「日本Androidの会」の登録者に送られています。
> このグループに投稿するには、android-g...@googlegroups.com にメールを送信してください。
> このグループから退会するには、android-group-j...@googlegroups.com にメールを送信してください。
> 詳細については、http://groups.google.com/group/android-group-japan?hl=ja からこのグループにアクセスしてください。
>
>

--
Yoshiko Miwa waruik...@gmail.com

ほのかパパ

unread,
May 23, 2011, 12:29:38 AM5/23/11
to 日本Androidの会
三輪さん

> 東京在住ですが、月に1~4回はつくば市に行っていますよ。週に3日ほど毎週滞在していた時期も。
> 筑波大の大学院に在学しているからですが、学業は全然進まず、経路にあるスーパーの特売の傾向と対策にやたら詳しくなりました。
> 行くと必ず買ってくるのは、干し納豆です。

筑波大の近くに住んでます。
スーパーの特売の傾向は興味深いですね!だいたいとりせんなので(^^)
アプリにしたらおもしろいですかね?

今後ともいろいろな情報交換をよろしくお願いします

Takahiro Shimokawa

unread,
May 23, 2011, 2:54:32 AM5/23/11
to 日本Androidの会
はじめまして。
下川と申します。

現在、茨城支部の設立に向けて活動してます。
以前に、こんな投稿もしてますので、ご参考ください。

・茨城支部の設立準備会を立ち上げました
https://groups.google.com/group/android-group-japan/browse_thread/thread/6841f65e7eeb0888?hl=ja

運営をお手伝い頂ける方も、大募集中ですので、ご興味ありましたら
お気軽にご連絡ください。

また、準備会の活動報告やキックオフ予定などについては、
別途告知させて頂きますので、もうしばらくお待ちください。

よろしくお願いいたします。

ほのかパパ

unread,
May 23, 2011, 3:45:49 AM5/23/11
to 日本Androidの会
下川さん

> 現在、茨城支部の設立に向けて活動してます。
> 以前に、こんな投稿もしてますので、ご参考ください。
>
> ・茨城支部の設立準備会を立ち上げましたhttps://groups.google.com/group/android-group-japan/browse_thread/thr...
>
> 運営をお手伝い頂ける方も、大募集中ですので、ご興味ありましたら
> お気軽にご連絡ください。

茨城支部の設立準備会があったのですね。
調べる前に投稿してしましました。(^^;)
参加させていただきます。
よろしくお願い致します。

MORIATSU IRI

unread,
May 23, 2011, 3:53:09 AM5/23/11
to android-g...@googlegroups.com
ほのかパパさんこんにちわ。
miriと言います。
Androidアプリを作りたくてこのMLに参加してますが、未だに準備が
整ってません(^^;

私の知っている文字認識の例をご説明しますね。
画像から1文字を特定するにしても、1イメージ1文字ではないですよね。
だから色々前処理が必要なんです。

1.画像の向き検出・補正
2.画像の傾き検出・補正
3.画像の中から余白を検出して余白削除したりノイズを削除したり。
4.段組などを識別(縦2段組とか縦書き/横書きとか挿絵とか)して切り出し
5.縦書き横書きを識別
6.行ピッチ(行間の空き具合等)を推測して1行を切り出す。
7.1行分のデータから文字ピッチ(1文字の幅)を推測して1文字ずつ切り出す。

ここまででやっと一枚のイメージから一文字を切り出せたことになります。
さて、これから一文字のイメージを一文字(の文字コード)にする事になる
訳ですが、これは色々な方法が考案され、実践されていますが、この認識の
方法が文字認識エンジンを持つ各社の売りになっている訳で、ここを詳細に
説明してくれるところはなかなか無いと思います(^^;
文字の特徴などを元に、識別したり、ベクタライズしたり色々考えられて
います。
当然、文字の特徴をため込んで認識に使用するする為の辞書が必要になる
と思います。
また日本語としての辞書を用いて、前後の文字や文脈から、文字の候補を
「ー」(長音)と「一」(漢数字の1)を切り替える等の細かい品質アップの
努力をしています。 というか、こうでもしないと、認識品質を揚げられ
ないのです。
フォントによる字体の違いやItalic体・Bold体等の若干の違いを吸収し、
それなりの品質を得るには努力が必要です。
まずは、アラビア数字を認識できるように…とか小さい範囲で始めた方が
よろしいかと思います。
また、手順概略を見ても想像できるように、画像処理が結構多いです。
これもそれなりのハードルがあるでしょうが、最近はライブラリなどで
大分楽になっていると思いますよ。
がんばってください。

検索キーワードとしては「文字認識」ですかねぇ…

2011年5月20日13:08 ほのかパパ <yo.on.t...@gmail.com>:

> --
> このメールは Google グループのグループ「日本Androidの会」の登録者に送られています。
> このグループに投稿するには、android-g...@googlegroups.com にメールを送信してください。
> このグループから退会するには、android-group-j...@googlegroups.com にメールを送信してください。
> 詳細については、http://groups.google.com/group/android-group-japan?hl=ja からこのグループにアクセスしてください。
>
>


--
井利 盛厚
mi...@miri.org

ほのかパパ

unread,
May 23, 2011, 6:34:01 AM5/23/11
to 日本Androidの会
miriさん

> Androidアプリを作りたくてこのMLに参加してますが、未だに準備が
> 整ってません(^^;

ぜんぜん自分より整ってますよ!
↓知識がまったくないですから!

> 私の知っている文字認識の例をご説明しますね。
> 画像から1文字を特定するにしても、1イメージ1文字ではないですよね。
> だから色々前処理が必要なんです。
>
> 1.画像の向き検出・補正
> 2.画像の傾き検出・補正
> 3.画像の中から余白を検出して余白削除したりノイズを削除したり。
> 4.段組などを識別(縦2段組とか縦書き/横書きとか挿絵とか)して切り出し
> 5.縦書き横書きを識別
> 6.行ピッチ(行間の空き具合等)を推測して1行を切り出す。
> 7.1行分のデータから文字ピッチ(1文字の幅)を推測して1文字ずつ切り出す。

ここまで読んで気が遠くなりました。(^^;)

> 当然、文字の特徴をため込んで認識に使用するする為の辞書が必要になる
> と思います。
> また日本語としての辞書を用いて、前後の文字や文脈から、文字の候補を
> 「ー」(長音)と「一」(漢数字の1)を切り替える等の細かい品質アップの
> 努力をしています。 というか、こうでもしないと、認識品質を揚げられ
> ないのです。
> フォントによる字体の違いやItalic体・Bold体等の若干の違いを吸収し、
> それなりの品質を得るには努力が必要です。

気絶しました。

> まずは、アラビア数字を認識できるように…とか小さい範囲で始めた方が
> よろしいかと思います。
> また、手順概略を見ても想像できるように、画像処理が結構多いです。
> これもそれなりのハードルがあるでしょうが、最近はライブラリなどで
> 大分楽になっていると思いますよ。
> がんばってください。
>
> 検索キーワードとしては「文字認識」ですかねぇ…

目が覚めました。貴重な助言ありがとうございます。がんばりたいと思います。

MIWA Yoshiko

unread,
May 23, 2011, 8:13:12 AM5/23/11
to android-g...@googlegroups.com
ほのかパパさん

2011年5月23日13:29 ほのかパパ <yo.on.t...@gmail.com>:

つくばにはじめて来る方のための情報、もうちょっとあった方がいいですよね。特売情報によらず。
たとえば
「敏感肌の人のためのシャンプーはどこで買えますか?」
といった情報が、はじめてだとなかなか得られなかったりします。

> 今後ともいろいろな情報交換をよろしくお願いします

大垣憲俊

unread,
May 25, 2011, 10:55:33 AM5/25/11
to android-g...@googlegroups.com
ほのかパパさん

大垣です。まだ出版されたばかりで、私も今日買ったばかりですが、
かなり良いと思いますので、紹介します。

「C言語による画像処理プログラミング入門」
長尾 智晴/著 昭晃堂/発行
ISBN 978-4-7856-3179-6

(アフィリエイト目的ではありません、念のため)


ほのかパパ

unread,
May 25, 2011, 7:52:28 PM5/25/11
to 日本Androidの会
大垣さん

ほのかパパです。

> 「わかりやすいパターン認識」
> ISBN-10: 4274131491
> ISBN-13: 978-4274131493

以前ご紹介いただいた本、昨日発注・購入しました。

> 「C言語による画像処理プログラミング入門」
> 長尾 智晴/著 昭晃堂/発行
> ISBN 978-4-7856-3179-6
>
> (アフィリエイト目的ではありません、念のため)http://www.shoko-do.co.jp/infobooks/ISBN978-4-7856-3179-6.html

サンプルをダウンロードしてみましたが、なんか良さそうですね。
わかりやすいパターン認識より良いですか?

大垣憲俊

unread,
May 25, 2011, 9:33:43 PM5/25/11
to 日本Androidの会
ほのかパパさん

大垣です。

> わかりやすいパターン認識より良いですか?

はい。ちょっとネタばらしをしてしまうと、
わかりやすいパターン認識は要するにベイズ推定Loveです。
こちらの本は手法の紹介なので実践的でとっつきやすいです。

私が気に入ったのは、古典的なゾンデ法、テンプレートマッチング、
k-平均法によるクラスタリング、特徴量を用いた図形認識、平仮名の認識、あたり。
とくに、11章、12章は、もっと知りたいと思うほど、重要なことが整理されています。
Reply all
Reply to author
Forward
0 new messages