とりあえず、敷居が低そうなWindows上でのテスト方法を。
1) Softi Free OCR
http://softi.co.uk/freeocr.htm
からダウンロードできます。Tesseract エンジンを使っているそうです。
実行するとサンプルがすぐに現れるので、テストをするのも簡単です。
2) Tesseract のWindowsバイナリで試す
http://code.google.com/p/tesseract-ocr/downloads/list
からダウンロードできます。
今回は、
tesseract-2.01.exe.tar.gz Windowsバイナリ
tesseract-2.00.eng.tar.gz English language data for Tesseract (2.00
and up)
をダウンロードし、展開。
tesseract-2.01.exeフォルダの中にtessdataフォルダを配置しました。
bmpファイルで適当に文章を作り、コマンドラインから、
>tesseract test.bmp test
とすると、test.txt というファイルが作成されました。
エラーメッセージなどは、tesseract.log に書き込まれます。
OcropusがWindows上で走るようになるのはもう少しかかるかもしれませんね。