Zeichen oder Wörter zählen im PDF?

124 views
Skip to first unread message

Wolfgang Hugemann

unread,
Sep 19, 2006, 6:57:22 AM9/19/06
to frame
Ich muss über den Seitenpreis fürs Korrektorat betreffend ein Buch
verhandeln. Das Buch enthält enorm viele Abbildungen und ist teils mit
Frame, teils mit Word erstellt. Ich würde gerne die durchschnittliche
Anzahl von Zeichen pro Seite ermitteln und könnte mich dabei am
einfachsten auf ein komplettes PDF stützen.

Leider hat auch Acrobat Professional 7.0 unter den
Dokumenteneigenschaften' keine Statistik, wie etwa Word.

Anscheinend gibt es ein PlugIn, auf dass sich ein Beitrag in einem Forum
(http://www.pdfzone.de/forum/?befehl=show&beitrag=1119511254Actino#1119511254Actino)
bezieht, aber der Name wird dort nicht genannt. (Wäre auch nur
interessant, wenn es erschwinglich wäre.)

Gibt es eine einfache Möglichkeit, solche statistischen Daten aus dem
PDF zu ermitteln? (Andernfalls müsste ich mich kapitelweise auf die
entsprechenden Funktionen in Frame+Word stützen.)

Gruß aus Münster
Wolfgang Hugemann


###############################################################
Bitte beim Zitieren und Diskutieren die Listenregeln beachten!!
http://www.frame-user.de/?listenregeln

Karin Hoffmann

unread,
Sep 19, 2006, 7:01:42 AM9/19/06
to frame
Hallo,

> Leider hat auch Acrobat Professional 7.0 unter den
> Dokumenteneigenschaften' keine Statistik, wie etwa Word.

> Gibt es eine einfache Möglichkeit, solche statistischen Daten aus dem

> PDF zu ermitteln? (Andernfalls müsste ich mich kapitelweise auf die
> entsprechenden Funktionen in Frame+Word stützen.)

ich würde das Dokument als RTF speichern und die Zeichen in Word zählen.

Gruß,

Karin Hoffmann

www.ect-telecoms.de

Markus Müller-Trabucchi

unread,
Sep 19, 2006, 7:03:31 AM9/19/06
to frame
Hallo Herr Hugemann,

> Anscheinend gibt es ein PlugIn, auf dass sich ein Beitrag in einem Forum
>
(http://www.pdfzone.de/forum/?befehl=show&beitrag=1119511254Actino#1119511254Actino)

>

Da es sich bei dem Verfasser des Beitrags um den GF von actino, *des*
PDF-PlugIn-Distributors in Deutschland handelt, würde ich auf deren HP
mal recherchieren, oder per E-Mail anfragen:
http://www.actino.de/home.htm


Wenn es weiterhilft, könnte ich Ihnen (offline) weiterhelfen: wir haben
für einen ähnlichen Zweck mal ein Acrobat-Statistik-PlugIn erstellt ...
allerdings wird da nur die Wortanzahl ausgegeben.

Gruss aus der wieder grauen Hauptstadt,
--
Markus Müller-Trabucchi
Cross Media Publishing
SRZ Berlin | Firmengruppe besscom
http://www.srz.de
tel +49 30 75301-377 | fax +49 30 75301-11377


____________
Virus checked by G DATA AntiVirusKit

Wolfgan...@leica-geosystems.com

unread,
Sep 19, 2006, 7:07:23 AM9/19/06
to frame

Hallo Wolfgang,

einen direkten Weg zur Lösung deines Problems kenne ich leider auch nicht.
Du kannst aber ganz einfach den gesamten Text in der PDF markieren,
kopieren und (z.B.) in Word einfügen - und die dort vorhandenen Tools zur
Auswertung verwenden.
In Acrobat musst du dazu das "Seitenlayout" auf "Fortlaufend" stellen,
danach einfach mit dem Texttool irgendwo in die PDF klicken und mit "Ctrl"
"a" den gesamten Text markieren.
Leider werden mit dieser Methode auch Kopf- und Fusszeilen, IHV, Idex o.ä.
generierte Teile mitkopiert.
Dennoch ist es eine relativ schnelle und kostengünstige Möglichkeit, um den
Textbestand zu "zählen"

Grüsse
Wolfgang

***************************************************
Wolfgang Reiner
Technical Documentation

Leica Geosystems AG
Heinrich-Wild-Strasse, CH-4935 Heerbrugg
Phone: +41 71 727 4425
***************************************************

- when it has to be right, Leica Geosystems

Guido Carl

unread,
Sep 19, 2006, 7:08:33 AM9/19/06
to frame
Hallo.

Wolfgang Hugemann schrieb:


> Gibt es eine einfache Möglichkeit, solche statistischen Daten aus dem
> PDF zu ermitteln? (Andernfalls müsste ich mich kapitelweise auf die
> entsprechenden Funktionen in Frame+Word stützen.)

Es gibt ein kostenloses (!) Plugin:
http://www.abracadabrapdf.net/pages/fr/abratools.
Haben wir aber noch nicht genutzt.

Mit freundlichen Grüßen,
G. Carl


Guido Carl
Jäger Computergesteuerte Messtechnik GmbH
Rheinstr. 2-4
D-64653 Lorsch

email: GC...@ADwin.de
Web: www.ADwin.de
Fon: +49-(0)6251-9632-0
Fax: +49-(0)6251-56819

Wolfgang Kühn

unread,
Sep 19, 2006, 7:16:09 AM9/19/06
to frame
Hallo,

mir bekannt ist der PDF-Analyzer, welcher kostenlos zu haben ist. Es
gibt ihn aber auch in einer Pro-Version.
http://www.is-soft.de

Grüße
Wolfgang Kühn

Harald Zimmermann

unread,
Sep 19, 2006, 7:55:35 AM9/19/06
to frame
Ich würde auf jeden Fall versuchen nicht über Seiten, sondern über Worte zu verhandeln. Das geht für beide Seiten einfacher.
Gruß Harald

> -----Original Message-----
> From: fr...@list.globalworks.de [mailto:fr...@list.globalworks.de]On
> Behalf Of Wolfgang Hugemann
> Sent: Tuesday, September 19, 2006 12:57 PM
> To: frame
> Subject: Zeichen oder Wörter zählen im PDF?
>
>
> Ich muss über den Seitenpreis fürs Korrektorat betreffend ein Buch
> verhandeln. Das Buch enthält enorm viele Abbildungen und ist
> teils mit
> Frame, teils mit Word erstellt. Ich würde gerne die durchschnittliche
> Anzahl von Zeichen pro Seite ermitteln und könnte mich dabei am
> einfachsten auf ein komplettes PDF stützen.

Wolfgang Hugemann

unread,
Sep 19, 2006, 9:22:00 AM9/19/06
to frame
Vielen Dank für die vielen Hinweise. Hier mein Erfahrungsbericht dazu:

1) Export als RTF
Die Möglichkeit war mir bekannt, führt aber bei vielen Abbildungen und
über 1.000 Seiten zu unbeherrschbar großen Word-Dateien.

2) Actino
Also, ich konnte auf deren Site nichts dergleichen finden, auch nicht
indem ich in Google mit
"wörter zählen" site:www.actino.de
gesucht habe.

3) PDF-Analyzer
Ist eine kostenlose Standalone-Lösung, mit der man wohl schnell die
Wesentlichen Eigenschaften eines PDF-Dokuments ergründen kann. Im Test
mit meinen bildlastigen Dateien versagte es aber kläglich: Das Einlesen
und die Analyse dauerten sehr lange und lieferten krass falsche
Ergebnisse. Bei der kompletten Buchdatei (>1.000 Seiten und etwa 500 MB)
verabschiedete sich das Programm mit einer Fehlermeldung, nachdem es die
Auslagerungsdatei auf 1,5 GB aufgeblasen hatte.

4) AbracadabraTOOLS 2.5
Es handelt sich um ein JavaScript, das bei mir funktioniert, nachdem ich
es in den JavaScript-Ordner kopierte habe (und nicht in den Unterordner
Abracadabra). Nach einigen Minuten meldete es: 503.687 Wörter.

Ich habe die Ergebnisse des Tools mit Words Ergebnissen (in den
Ausgangsdateien) verglichen und es scheint korrekt zu arbeiten: Es zählt
stets etwas mehr Wörter als Word. Dies sollte auch der Fall sein, weil
Abbildungsunterschriften (und anderes mehr) bei mir in Textboxen stehen
und Word nur den Haupttext durchzählt.

.............

Also, ich bin fürs erste zufrieden :-)

Reply all
Reply to author
Forward
0 new messages