数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美国内华达州信息
技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。
在修复了最重要的数个漏洞后,Google两个月前认为,Tesseract OCR已经足够稳定,可以重新以开源软件方式发布。
Google已经开始在网站上招聘高级OCR技术工程师,值得我们注意的是,Google在这段招聘启示下写道:"Google currently
"reads" almost every web page in the world. Come help us read all the
printed material as well!"(Google现在已经能够"阅读"世界上几乎所有网页,你的到来将让Google阅读所有印刷
信息!)
http://www.google.com/support/jobs/bin/answer.py?answer=23733