Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

In Python PDF-Dokumente nach Begriffen durchsuchen

161 views
Skip to first unread message

krystian

unread,
Sep 7, 2009, 5:38:58 AM9/7/09
to
Hallo zusammen,

Ich bin interessiert an einer python bibliothek mit der ich PDF-
Dokumente nach Begriffen durchsuchen kann.
Im Internet habe ich ein projekt gefunden, PdfSearchGui-0.3, da aber
unvollständig scheint.
Denn nach Einbindung aller noch davon abhängigen Libs bekomme ich
folgenden Fehler:

Traceback (most recent call last):
File "main.py", line 3, in <module>
from manager import conlongdos as conlongdos
File "C:\ Trainings\PDF\PdfSearchGui-0.3\manager.py", line 3, in
<module>
from indexer import Indexer
File "C: \Trainings\PDF\PdfSearchGui-0.3\indexer.py", line 14, in
<module>
from lupy.analysis.simpleanalyzer import SimpleAnalyzer
ImportError: No module named analysis.simpleanalyzer

Das Modul "analysis.simpleanalyzer " gibt es auch nicht.
Mein Problem ist jetzt, die Lib Lupy wird nicht mehr gepflegt und ich
scheine eine unpassende Version erwischt zu haben.

1. Kennt jemand das Problem und kann mir da weiterhelfen?
2. Was gibt es noch für Python Projekte, die sich mit PDF-Dokumenten
beschäftigen?

Danke im Voraus
krystian

Thomas Guettler

unread,
Sep 7, 2009, 10:25:24 AM9/7/09
to
Hallo,

man kann sich auch externer (nicht-Python) Programme bedienen, und
die per Python ansprechen (Modul subprocess).

zB pdftotext ist auf den meisten Linux-Systemen vorhanden. Es ist ein
Teil von xpdf. Vielleicht gibt es auch eine Windowsversion von dem Programm.

Sehr m�chtig ist auch pdftk. Damit kann man einzelne Seiten extrahieren,
Wasserzeichen hinterlegen, ....

Gru�,
Thomas

krystian schrieb:


> Hallo zusammen,
>
> Ich bin interessiert an einer python bibliothek mit der ich PDF-
> Dokumente nach Begriffen durchsuchen kann.
> Im Internet habe ich ein projekt gefunden, PdfSearchGui-0.3, da aber

> unvollst�ndig scheint.
> Denn nach Einbindung aller noch davon abh�ngigen Libs bekomme ich


> folgenden Fehler:
>
> Traceback (most recent call last):
> File "main.py", line 3, in <module>
> from manager import conlongdos as conlongdos
> File "C:\ Trainings\PDF\PdfSearchGui-0.3\manager.py", line 3, in
> <module>
> from indexer import Indexer
> File "C: \Trainings\PDF\PdfSearchGui-0.3\indexer.py", line 14, in
> <module>
> from lupy.analysis.simpleanalyzer import SimpleAnalyzer
> ImportError: No module named analysis.simpleanalyzer
>
> Das Modul "analysis.simpleanalyzer " gibt es auch nicht.
> Mein Problem ist jetzt, die Lib Lupy wird nicht mehr gepflegt und ich
> scheine eine unpassende Version erwischt zu haben.
>
> 1. Kennt jemand das Problem und kann mir da weiterhelfen?

> 2. Was gibt es noch f�r Python Projekte, die sich mit PDF-Dokumenten
> besch�ftigen?
>
> Danke im Voraus
> krystian


--
Thomas Guettler, http://www.thomas-guettler.de/
E-Mail: guettli (*) thomas-guettler + de

Florian Diesch

unread,
Sep 16, 2009, 2:54:29 PM9/16/09
to
krystian <stadler.ch...@googlemail.com> writes:


> 2. Was gibt es noch f�r Python Projekte, die sich mit PDF-Dokumenten
> besch�ftigen?

Schau mal unter <http://vermeulen.ca/python-pdf.html>

Florian
--
<http://www.florian-diesch.de/software/pdfrecycle/>

0 new messages