OCR e Processamento de Imagem

1,236 views
Skip to first unread message

Silvio Luiz

unread,
Jul 11, 2013, 3:11:35 PM7/11/13
to startup...@googlegroups.com
Boa tarde pessoALL tudo bem?

Alguém aqui trabalhando com processamento de imagem? Estou avaliando utilizar OCR em algumas idéias como diferencial, mas gostaria de saber a viabilidade técnica e financeira de adotar uma solução como essa em uma feature de produto. Podem ser api's/frameworks Java/Ruby/NodeJs..

Att,

Silvio Luiz

horacio...@gmail.com

unread,
Jul 17, 2013, 1:18:56 PM7/17/13
to startup...@googlegroups.com
Quanto a licença pelo que vi até agora tem bibliotecas gratuitas, por exemplo, eu usei em python a Tesseract, para checar comprovantes de depósitos dos bancos. Algo parecido com o que o Lemon faz, bem mais simples ;)

Não tive problemas para implementar, mas tb não tive demanda suficiente para lhe responder se processar isso sai caro. Mas é óbvio que é possível, pois a infraestrutura em nuvens está para você escalar sob demanda. 

Eu acho um diferencial muito show de bola. Reconhecimento de imagens e processar isso de forma lógica é sensacional. Sucesso!




2013/7/11 Silvio Luiz <silvi...@gmail.com>

--
Você está recebendo esta mensagem porque se inscreveu no grupo "Startup Brasil" dos Grupos do Google.
Para cancelar a inscrição neste grupo e parar de receber seus e-mails, envie um e-mail para startup-brasi...@googlegroups.com.
Para obter mais opções, acesse https://groups.google.com/groups/opt_out.
 
 



--
[]'s
Horacio Ibrahim

Lauro Ojeda

unread,
Jul 17, 2013, 11:02:05 AM7/17/13
to startup...@googlegroups.com
Num produto meu usamos o OpenCV for Android, mas nesse caso tivemos que escrever toda a lógica de reconhecimento de OCR.
Mas tem produtos muito bons e fáceis de usar como o Tesseract (Tess) e um outro que esqueci o nome, desenvolvido por uma universidade alemã.

Flw.


--
Você está recebendo esta mensagem porque se inscreveu no grupo "Startup Brasil" dos Grupos do Google.
Para cancelar a inscrição neste grupo e parar de receber seus e-mails, envie um e-mail para startup-brasi...@googlegroups.com.
Para obter mais opções, acesse https://groups.google.com/groups/opt_out.
 
 



--
Lauro Ojeda
Msc. Empreendedorismo e Inovação
Fone: +55 65 9921-1026

Leandro Cesquini Pereira

unread,
Jul 18, 2013, 9:24:11 AM7/18/13
to startup...@googlegroups.com
Existe uma gem (Ruby) chamada docsplit que utiliza o tesseract para extrair texto de pdf.

Ricardo Othuki

unread,
Jul 18, 2013, 11:51:07 AM7/18/13
to startup...@googlegroups.com
O que exatamente você quer fazer? OCR ou tratamento de imagens? são soluções bem distintas...

Estou trabalhando algum tempo em um algoritmo para Optical Character Recognition ou Reconhecimento ótico de caracteres para um aplicativo que estou desenvolvendo (caderno digital) multi-plataforma e cross-device.

O principal device é o Tablet, mas como falei, vai rodar em qualquer computador, por este motivo utilizo o HTML5 + Javascript como linguagem.

Depois de várias pesquisas infrutiferas na internet por soluções OCR (free) para este ambiente (browser), resolvi desenvolver meu próprio algoritmo de reconhecimento de escrita cursiva.



Silvio Luiz

unread,
Jul 18, 2013, 2:49:34 PM7/18/13
to startup...@googlegroups.com
Obrigado pelas respostas pessoal..

Perdão me expressei mal Ricardo, seria OCR mesmo. A idéia é recuperar textos a partir de imagens scaneadas, uma das possibilidades seria ler "imagens" com seções pré-definidas (como nota fiscal de supermercado por exemplo) - essa "lógica" faz parte do que precisaria implementar....

Enfim, não conheço as soluções disponíveis para OCR, mas preferencialmente uma solução homogênea que pudesse servir para webapp's e desktop

Pode compartilhar quais foram suas frustrações com as opções free?



Att,

Silvio Luiz


Ricardo Othuki

unread,
Jul 18, 2013, 7:30:22 PM7/18/13
to startup...@googlegroups.com
Silvio, simplesmente não achei nada que funciona-se diretamente no Browser (nem free nem pago).

No meu caso, preciso analisar o que o usuário esta escrevendo na tela do dispositivo, em tempo real, e que funcione sem a necessidade de estar conectado com a internet. Ou seja, uma solução no lado do cliente, no caso um navegador WEB rodando HTML5.

Já tenho bastante código pronto e funcional, mas ainda preciso aperfeiçoar a técnica de separar as letras de uma palavra cursiva. A identificação de letras e números separados já esta bem madura, além de poder aprender com o uso (calibração automática).

Mas identificar e separar as letras em uma palavra desenhada com o uso do dedo ou mouse na tela do  dispositivo esta sendo um grande desafio.




Giovanni K Bonetti

unread,
Jul 18, 2013, 11:52:35 PM7/18/13
to startup...@googlegroups.com
Já experimentou o Fine Reader? Eu uso bastante, principalmente pra tornar um PDF escaneado em texto pesquisável.

Abraço,
Giovanni




2013/7/18 Silvio Luiz <silvi...@gmail.com>

sfigs

unread,
Jul 19, 2013, 12:02:27 PM7/19/13
to startup...@googlegroups.com
Olá,

Usamos muito isso na nossa app, e anteriormente trabalhamos em projetos que processávamos alguns milhares de documentos. O jeito mais profissional é você criar um bridge para uma engine. De todas que usamos, inclusive as frees, as realmente boas são:

Abbyy FineReader
Muito, muito boa. Filtro de imagens excelente, porém é um pouco (bem chato) integrar em Java, que é o que utilizamos. Muitas vezes o bridge dá problemas. O suporte deles também é bom. O problema é que é meio salgado, já que você paga por imagem processada e eu nunca vi uma licença deles que fosse ad eternum (pago 1x e binarizo quantas imagens quiser). Também fornece a leitura por templates de documento, que é o que você busca.

Iris DocumentServer
Muito boa também, mas eu ainda acho a qualidade um pouco mais baixa que a Abbyy. Também fornece a leitura por templates que você busca. É muito fácil de integrar, já que até no server trabalha com conceitos de in/out (envio um arquivo pra uma pasta, e dependendo da configuracao dessa pasta, ele cai na out do jeito específico). Então você faz as integrações que quiser. A Abbyy também tem isso, a questão é que não em modo servidor, mas apenas cliente. O Iris é um Document server, é diferente.

Existem outras pagas também e que são boas, como a Pegasus. Mas elas tem perdido mercado pois não tem se tornado tão inovadoras quanto a Abbyy ou a Iris.

Fuja das frees, Tesseract e cia são osso duro de roer. Taxas de reconhecimento muito, muito baixas. Eu não encontrei nenhuma engine free ou opensource que fosse boa, e olha que foram 6 meses de teste.

Boa sorte!

Gustavo

unread,
Jul 19, 2013, 5:56:06 PM7/19/13
to startup...@googlegroups.com
Minha sugestão é darem uma pesquisada em OCR + Redes Neurais Artificiais.

Pode expandir vários horizontes.

Marcel Ferrante

unread,
Jul 20, 2013, 11:36:30 AM7/20/13
to startup...@googlegroups.com
Segue alguns bookmarks que tenho sobre o assunto.
Recomendo usar C#, pois vai ser mais facil encontrar SDK para essa linguagem.
Abs
Marcel
 

OCR

Paid

 

 

AWare Systems custom development in Delphi and beyond

AWare Systems custom development in Delphi and beyond
Last Modified: Tue, 25 May 2004 16:18:09 GMT

Delphi32.com -- VCL - Components: Multimedia: Graphic Components -OCR Toolkit for Delphi

OCR Toolkit for Delphi is an Optical Character Recognition vcl component......
Last Modified: Sun, 07 Dec 2003 16:12:36 GMT

efg's Reference Library: Delphi Graphics Algorithms -- Image Processing

lista
Last Modified: Tue, 25 May 2004 17:53:53 GMT

http://www.componentsource.com/product.asp?SC=CS&PO=510121&option=7203&bhcp=1

Last Modified: Sun, 07 Dec 2003 16:42:34 GMT

ICR/OCR: links to Companies Products Tests

Lis
Last Modified: Mon, 31 May 2004 17:46:58 GMT

ImagEntry for keying data from images. Image indexing ... OCR reject repair ... HCFA data ... ERP information

Professional data enty software lets you key data up to nine times as fast, twice as accurate. CLICK HERE for details and demo.
Last Modified: Thu, 11 Mar 2004 16:34:29 GMT

MCM DESIGN - Imaging Toolkit for Delphi OCR +++

Last Modified: Sun, 07 Dec 2003 16:13:02 GMT

OCR - OCR SDK includes APIs, COM and .Net OCR Programming Support. +++

LEADTOOLS ocr imaging +++
Last Modified: Tue, 25 May 2004 14:45:59 GMT

Products - Tiger -Cuneiform

Last Modified: Mon, 31 May 2004 17:45:19 GMT

QBS Software +++

imaging ocr scanner driver
Last Modified: Tue, 25 May 2004 16:22:45 GMT

SKYLINE TOOLS IMAGING - DOCUMENT IMAGING, MEDICAL IMAGING, INTERNET, VIDEO/MULTIMEDIA, AND DOCUMENT MANAGEMENT APPLICATIONS

Skyline Tools presents Imagelib - imaging and multimedia components for application development. Skyline Tools presents Imagelib - imaging and multimedia components for application development. 
Last Modified: Tue, 25 May 2004 16:09:25 GMT

TEhnTwain

download
This bookmark is not explored yet

Twain and Delphi



Atalasoft

lista de toolkits para imaging
Last Modified: Tue, 25 May 2004 16:32:18 GMT


DotImage ISIS SDK -  Imaging SDKs for .NET developers

TWAIN-- Standard for image acquisition devices. +++

scanner drivers tookit
Last Modified: Tue, 25 May 2004 16:30:41 GMT


Free

http://www.programmersheaven.com/zone2/cat646/

Programmers Heaven - Delphi & Kylix Zone - Scanners & Imageing files
Last Modified: Sun, 07 Dec 2003 16:32:15 GMT

Image tools free OCR

Image viewer editor gif jpg animation picture download user selection, include 200+ selected free downloads, Internet, Webmaster, Clipboard, including alternative tools of Reflection
Last Modified: Sun, 07 Dec 2003 16:37:02 GMT

SimpleOCR - the only royalty free OCRengine!

SimpleOCR is the only Royalty Free OCR toolkit! Text drive our free demo application, and save thousands on your custom OCR projects.
Last Modified: Sun, 07 Dec 2003 16:37:48 GMT

Torry's Delphi Pages

Torry's Delphi Pages
Last Modified: Sun, 07 Dec 2003 16:37:29 GMT

 
 
 
Att,
Marcel






--
Você está recebendo esta mensagem porque se inscreveu no grupo "Startup Brasil" dos Grupos do Google.
Para cancelar a inscrição neste grupo e parar de receber seus e-mails, envie um e-mail para startup-brasi...@googlegroups.com.

Para obter mais opções, acesse https://groups.google.com/groups/opt_out.
 
 



--
Marcel Ferrante Silva
(62) 8108-1277 (TIM)
"The Power of Ideas"
skype: marcelferrante
msn/gtalk: mar...@gmail.com
Reply all
Reply to author
Forward
0 new messages