Busca textual em arquivos PDF

130 views
Skip to first unread message

Reginaldo Costa

unread,
Apr 26, 2012, 2:03:05 AM4/26/12
to LISTA PHP
Pessoal preciso fazer uma busca textual dentro de arquivos PDF, tem como pelo PHP?

Rubens Takiguti Ribeiro

unread,
Apr 26, 2012, 8:15:43 AM4/26/12
to list...@googlegroups.com
Sim, é possível. O texto normalmente fica armazenado de forma codificada e compactada em um PDF. Existem algumas classes prontas que servem para o propósito, como esta:
http://www.phpclasses.org/package/702-PHP-Searches-pdf-documents-for-text.html

Porém, existem alguns PDF que armazenam imagens com texto. Neste caso, seria necessário um recurso um pouco mais elaborado: primeiro extrair as imagens, depois passar um reconhecimento de texto sobre ela.

Rubens Takiguti Ribeiro
Bacharel em Ciência da Computação - UFLA
Zend Certified Engineer - PHP 5
http://rubsphp.blogspot.com.br/



2012/4/26 Reginaldo Costa <regi...@ymail.com>
Pessoal preciso fazer uma busca textual dentro de arquivos PDF, tem como pelo PHP?

--
============================================================
JQUERY MAGAZINE > http://www.jquerymagazine.com.br
--
PHP MAGAZINE > http://www.phpmagazine.com.br
--
LISTA NODE.JS > https://groups.google.com/group/lista-nodejs?hl=pt-br
--
AJAX-BRASIL > http://groups.google.com/group/ajax-brasil
--
PYTHON-GOOGLE > http://groups.google.com.br/group/python-google
--
DOTNET-BRASIL > http://groups.google.com.br/group/dotnet_br
============================================================

Franklin Anderson de Oliveira Souza

unread,
Apr 26, 2012, 9:19:14 AM4/26/12
to list...@googlegroups.com
procura por uma classe php chamada pdf2txt .......

2012/4/26 Rubens Takiguti Ribeiro <rub...@gmail.com>



--
foobar
Reply all
Reply to author
Forward
0 new messages