東京在住ですが、月に1~4回はつくば市に行っていますよ。週に3日ほど毎週滞在していた時期も。
筑波大の大学院に在学しているからですが、学業は全然進まず、経路にあるスーパーの特売の傾向と対策にやたら詳しくなりました。
行くと必ず買ってくるのは、干し納豆です。
2011年5月23日8:59 ほのかパパ <yo.on.t...@gmail.com>:
> --
> このメールは Google グループのグループ「日本Androidの会」の登録者に送られています。
> このグループに投稿するには、android-g...@googlegroups.com にメールを送信してください。
> このグループから退会するには、android-group-j...@googlegroups.com にメールを送信してください。
> 詳細については、http://groups.google.com/group/android-group-japan?hl=ja からこのグループにアクセスしてください。
>
>
--
Yoshiko Miwa waruik...@gmail.com
私の知っている文字認識の例をご説明しますね。
画像から1文字を特定するにしても、1イメージ1文字ではないですよね。
だから色々前処理が必要なんです。
1.画像の向き検出・補正
2.画像の傾き検出・補正
3.画像の中から余白を検出して余白削除したりノイズを削除したり。
4.段組などを識別(縦2段組とか縦書き/横書きとか挿絵とか)して切り出し
5.縦書き横書きを識別
6.行ピッチ(行間の空き具合等)を推測して1行を切り出す。
7.1行分のデータから文字ピッチ(1文字の幅)を推測して1文字ずつ切り出す。
ここまででやっと一枚のイメージから一文字を切り出せたことになります。
さて、これから一文字のイメージを一文字(の文字コード)にする事になる
訳ですが、これは色々な方法が考案され、実践されていますが、この認識の
方法が文字認識エンジンを持つ各社の売りになっている訳で、ここを詳細に
説明してくれるところはなかなか無いと思います(^^;
文字の特徴などを元に、識別したり、ベクタライズしたり色々考えられて
います。
当然、文字の特徴をため込んで認識に使用するする為の辞書が必要になる
と思います。
また日本語としての辞書を用いて、前後の文字や文脈から、文字の候補を
「ー」(長音)と「一」(漢数字の1)を切り替える等の細かい品質アップの
努力をしています。 というか、こうでもしないと、認識品質を揚げられ
ないのです。
フォントによる字体の違いやItalic体・Bold体等の若干の違いを吸収し、
それなりの品質を得るには努力が必要です。
まずは、アラビア数字を認識できるように…とか小さい範囲で始めた方が
よろしいかと思います。
また、手順概略を見ても想像できるように、画像処理が結構多いです。
これもそれなりのハードルがあるでしょうが、最近はライブラリなどで
大分楽になっていると思いますよ。
がんばってください。
検索キーワードとしては「文字認識」ですかねぇ…
2011年5月20日13:08 ほのかパパ <yo.on.t...@gmail.com>:
> --
> このメールは Google グループのグループ「日本Androidの会」の登録者に送られています。
> このグループに投稿するには、android-g...@googlegroups.com にメールを送信してください。
> このグループから退会するには、android-group-j...@googlegroups.com にメールを送信してください。
> 詳細については、http://groups.google.com/group/android-group-japan?hl=ja からこのグループにアクセスしてください。
>
>
--
井利 盛厚
mi...@miri.org
2011年5月23日13:29 ほのかパパ <yo.on.t...@gmail.com>:
つくばにはじめて来る方のための情報、もうちょっとあった方がいいですよね。特売情報によらず。
たとえば
「敏感肌の人のためのシャンプーはどこで買えますか?」
といった情報が、はじめてだとなかなか得られなかったりします。
> 今後ともいろいろな情報交換をよろしくお願いします