ich habe folgendes Problem: Ich soll für meine Magisterarbeit einen
griechischen Text (11 Seite, Schriftart Greek, Word-Dokument)
bearbeiten.
Am Ende soll sich eine Wortliste aller im Text vorkommenden Wörter
befinden, mit Seiten- bzw. am besten Zeilenverweis zur Inschrift, in
der das Wort vorkommt.
Es sollte auch noch möglich sein, in diesem Index nachträglich
Anmerkungen anzufügen (z.B. Verweise auf weitere Textstellen,
Übersetzungen u.dergl.).
Mit Word bin ich dabei nicht wirklich weitergekommen (habe eine Tabelle
erstellt und diese als Quelle für den Index benutzt, aber Word
übernimmt einige Wörter entweder gar nicht oder falsch. Auf der Suche
nach einem stabileren und zuverlässigeren Programm bin ich auf LaTeX
gestoßen, habe aber im Internet keinen Baustein gefunden, der mein
Problem lösen könnte. Man muß offenbar immer jedes Wort einzeln für
den Index auswählen.Es wäre in meinem Fall (langer Text) aber
sinnvoller, die überflüssigen Wörter nachträglich aus dem Index zu
löschen.
Weiß jemand Rat? Gibt es einen solchen Baustein oder kennt jemand
vielleicht eine andere Methode? Mir wurde für Word VBA empfohlen,
womit ich mich aber auch nicht auskenne.
Beste Grüße
Henriette
> Hallo,
>
> ich habe folgendes Problem: Ich soll für meine Magisterarbeit einen
> griechischen Text (11 Seite, Schriftart Greek, Word-Dokument)
> bearbeiten.
>
> Am Ende soll sich eine Wortliste aller im Text vorkommenden Wörter
> befinden, mit Seiten- bzw. am besten Zeilenverweis zur Inschrift, in
> der das Wort vorkommt.
»Aller im Text vorkommenden Wörter«??
> Es sollte auch noch möglich sein, in diesem Index nachträglich
> Anmerkungen anzufügen (z.B. Verweise auf weitere Textstellen,
> Übersetzungen u.dergl.).
> Mit Word bin ich dabei nicht wirklich weitergekommen (habe eine Tabelle
> erstellt und diese als Quelle für den Index benutzt, aber Word
> übernimmt einige Wörter entweder gar nicht oder falsch. Auf der Suche
> nach einem stabileren und zuverlässigeren Programm bin ich auf LaTeX
> gestoßen, habe aber im Internet keinen Baustein gefunden, der mein
> Problem lösen könnte. Man muß offenbar immer jedes Wort einzeln für
> den Index auswählen.Es wäre in meinem Fall (langer Text) aber
> sinnvoller, die überflüssigen Wörter nachträglich aus dem Index zu
> löschen.
Hat der zu indizierende Text nun elf Seiten, wie du oben schreibst,
oder ist er »lang«? Außerdem schreibst du oben, alle vorkommenden
Wörter sollen indexiert werden, und hier willst du nun, dass alle
überflüssigen Wörter aus dem Index gelöscht werden sollen. Welche
Wörter sind denn überflüssig? Wie soll ein Rechner oder ein Programm
das wissen?
Natürlich musst /du/ als Autor festlegen, welche Wörter in den Index
aufgenommen werden sollen, und das entsprechende Programm darüber
informieren. Automatische Indexierung geht am Zweck -- Hilfsmittel
für den Leser -- vorbei.
> Weiß jemand Rat? Gibt es einen solchen Baustein oder kennt jemand
> vielleicht eine andere Methode?
Es ist mit LaTeX sehr einfach möglich auch komplexe Indices zu
erzeugen. Du musst nur die entsprechenden Wörter im Quelltext
auszeichnen; darum kommst du praktisch nicht herum. Den Rest
übernehmen LaTeX und MakeIndex oder xindy. Ob allerdings
Zeilenverweise möglich sind, weiß ich nicht. Ich hatte auch noch
kein Buch mit Zeilenverweisen im Index in der Hand. Was auch nur
dann sinnvoll ist, wenn der Text mit Zeilennummern versehen ist.
> Mir wurde für Word VBA empfohlen,
> womit ich mich aber auch nicht auskenne.
Für Word-bezogene Fragen suchst du dir am besten eine geeignete Gruppe.
Grüße,
Christoph
--
(La)TeX-FAQ: http://www.dante.de/faq/ +++ Minimalbeispiel erstellen
und Einführung in de.comp.text.tex: http://www.latex-einfuehrung.de/
+++ Veraltete Befehle, Pakete und andere Fehler:
ftp://ftp.dante.de/tex-archive/info/l2tabu/german/l2tabu.pdf
+++ Typografie-Regeln: http://zvisionwelt.de/downloads.html (1.51)
Ist bei Editionen nicht unüblich.
>> Es sollte auch noch möglich sein, in diesem Index nachträglich
>> Anmerkungen anzufügen (z.B. Verweise auf weitere Textstellen,
>> Übersetzungen u.dergl.).
>
>> Mit Word bin ich dabei nicht wirklich weitergekommen (habe eine
>> Tabelle erstellt und diese als Quelle für den Index benutzt, aber
>> Word übernimmt einige Wörter entweder gar nicht oder falsch. Auf
>> der Suche nach einem stabileren und zuverlässigeren Programm bin
>> ich auf LaTeX gestoßen, habe aber im Internet keinen Baustein
>> gefunden, der mein Problem lösen könnte. Man muß offenbar immer
>> jedes Wort einzeln für den Index auswählen.Es wäre in meinem Fall
>> (langer Text) aber sinnvoller, die überflüssigen Wörter
>> nachträglich aus dem Index zu löschen.
>
> Hat der zu indizierende Text nun elf Seiten, wie du oben schreibst,
> oder ist er »lang«?
Wenn man einen Text ediert, können elf Seiten verdammt lang sein :)
> Außerdem schreibst du oben, alle vorkommenden Wörter sollen indexiert
> werden, und hier willst du nun, dass alle überflüssigen Wörter aus
> dem Index gelöscht werden sollen. Welche Wörter sind denn
> überflüssig? Wie soll ein Rechner oder ein Programm das wissen?
Ich verstehe den OP so, daß er einen Index erstellen will, in dem jedes
Wort vorkommt, aber nicht jede einzelne Form dieses Wortes, sondern nur
das Lemma selbst (d.h. gehen ja, geht, gehe, gingen, gegangene nein).
Deswegen möchte er eine komplette Konkordanz erstellen und da die
überflüssigen Einträge für die einzelnen Wortformen entfernen. Das wird
man aber auch, wenn überhaupt, nur teilweise automatisieren können.
Um dem OP seine Frage zu beantworten, wäre es schon gut, wenn er sie
etwas näher ausführen könnte:
- hat er einen zusammenhängenden griechischen Text, oder mehrere
einzelne kurze Texte (es war von "Inschriften" die Rede)?
- hat er den griechischen Text eingebettet in einen deutschen/englischen
Text oder eigenständig (wichtig für Seiten-/Zeilennumerierung)?
- hat er eine genaue Vorstellung, was jetzt in den Index soll und was nicht?
Philipp
--
For contacting me via e-mail, please remove ".invalid" from my From:
address.
> Henri schrieb am 13.11.2006 12:41:
> ^^^^^ Hast du auch einen Nachnamen?
Ja, und den habe ich auch angegeben, da scheint aber irgendetwas nicht
geklappt zu haben.
Henriette Ebert
> > Hallo,
> >
> > ich habe folgendes Problem: Ich soll für meine Magisterarbeit einen
> > griechischen Text (11 Seite, Schriftart Greek, Word-Dokument)
> > bearbeiten.
> >
> > Am Ende soll sich eine Wortliste aller im Text vorkommenden Wörter
> > befinden, mit Seiten- bzw. am besten Zeilenverweis zur Inschrift, in
> > der das Wort vorkommt.
>
> »Aller im Text vorkommenden Wörter«??
Ja.
> > Es sollte auch noch möglich sein, in diesem Index nachträglich
> > Anmerkungen anzufügen (z.B. Verweise auf weitere Textstellen,
> > Übersetzungen u.dergl.).
>
> > Mit Word bin ich dabei nicht wirklich weitergekommen (habe eine Tabelle
> > erstellt und diese als Quelle für den Index benutzt, aber Word
> > übernimmt einige Wörter entweder gar nicht oder falsch. Auf der Suche
> > nach einem stabileren und zuverlässigeren Programm bin ich auf LaTeX
> > gestoßen, habe aber im Internet keinen Baustein gefunden, der mein
> > Problem lösen könnte. Man muß offenbar immer jedes Wort einzeln für
> > den Index auswählen.Es wäre in meinem Fall (langer Text) aber
> > sinnvoller, die überflüssigen Wörter nachträglich aus dem Index zu
> > löschen.
>
> Hat der zu indizierende Text nun elf Seiten, wie du oben schreibst,
> oder ist er »lang«? Außerdem schreibst du oben, alle vorkommenden
> Wörter sollen indexiert werden, und hier willst du nun, dass alle
> überflüssigen Wörter aus dem Index gelöscht werden sollen. Welche
> Wörter sind denn überflüssig? Wie soll ein Rechner oder ein Programm
> das wissen?
Ich finde, ein elf Seiten langer griechischer Text ist "lang", zumal
meine Magisterarbeit nicht nur aus dem Index bestehen soll, ich also
auch so noch viel Arbeit habe. Es handelt sich um eine
sprachwissenschaftliche Arbeit, die Wortliste soll dazu dienen, die
entsprechenden Stellen in den Inschriften leichter zu finden und auch
um zum Beispiel festzustellen, wie oft ein interessantes Wort im Text
auftaucht. Worte wie "und" und dergleichen wollte ich (nicht der
Computer!) dann wieder aus dem Index herausnehmen.
> Natürlich musst /du/ als Autor festlegen, welche Wörter in den Index
> aufgenommen werden sollen, und das entsprechende Programm darüber
> informieren. Automatische Indexierung geht am Zweck -- Hilfsmittel
> für den Leser -- vorbei.
>
> > Weiß jemand Rat? Gibt es einen solchen Baustein oder kennt jemand
> > vielleicht eine andere Methode?
>
> Es ist mit LaTeX sehr einfach möglich auch komplexe Indices zu
> erzeugen. Du musst nur die entsprechenden Wörter im Quelltext
> auszeichnen; darum kommst du praktisch nicht herum. Den Rest
> übernehmen LaTeX und MakeIndex oder xindy. Ob allerdings
> Zeilenverweise möglich sind, weiß ich nicht. Ich hatte auch noch
> kein Buch mit Zeilenverweisen im Index in der Hand. Was auch nur
> dann sinnvoll ist, wenn der Text mit Zeilennummern versehen ist.
Die könnte man ja einfügen.
So habe ich mir das vorgestellt und gehofft, daß es ein Programm gibt,
welches mir ein bißchen Arbeit abnimmt, da ich ja den Text selbst
bearbeiten muß und der Index/die Wortliste nur ein Zusatz sein soll.
> Um dem OP seine Frage zu beantworten, wäre es schon gut, wenn er sie
> etwas näher ausführen könnte:
> - hat er einen zusammenhängenden griechischen Text, oder mehrere
> einzelne kurze Texte (es war von "Inschriften" die Rede)?
> - hat er den griechischen Text eingebettet in einen deutschen/englischen
> Text oder eigenständig (wichtig für Seiten-/Zeilennumerierung)?
> - hat er eine genaue Vorstellung, was jetzt in den Index soll und was nicht?
Es handelt sich um mehrere Inschriften (48 Stück).
Der Text wird später in meine Magisterarbeit eingebettet sein,
zusammmen mit einer (deutschsprachigen) Einleitung, Übersetzung,
Bestimmung der grammatischen/sprachlichen und inhaltlichen
Besonderheiten und der Wortliste am Ende.
Es sollen die Nennformen (gehen) aufgelistet sein, darunter evtl. noch
unregelmäßige bzw. vom Standard abweichende gebeugte Formen (du gehst
...). Worte wie "und" und dergleichen würde ich natürlich wieder aus
der Konkordanzdatei löschen müssen.
Hmm, ich vermute, weil da "für meine Magisterarbeit [...]
bearbeiten" steht, dass da noch nicht-griechischer Text
dazukommt. Und dann sollte nur der griechische Text
indiziert werden.
> > Es sollte auch noch möglich sein, in diesem Index nachträglich
> > Anmerkungen anzufügen (z.B. Verweise auf weitere Textstellen,
> > Übersetzungen u.dergl.).
>
> > Mit Word bin ich dabei nicht wirklich weitergekommen (habe eine Tabelle
> > erstellt und diese als Quelle für den Index benutzt, aber Word
> > übernimmt einige Wörter entweder gar nicht oder falsch. Auf der Suche
> > nach einem stabileren und zuverlässigeren Programm bin ich auf LaTeX
> > gestoßen, habe aber im Internet keinen Baustein gefunden, der mein
> > Problem lösen könnte. Man muß offenbar immer jedes Wort einzeln für
> > den Index auswählen.Es wäre in meinem Fall (langer Text) aber
> > sinnvoller, die überflüssigen Wörter nachträglich aus dem Index zu
> > löschen.
>
> Hat der zu indizierende Text nun elf Seiten, wie du oben schreibst,
> oder ist er »lang«?
Naja, um jedes Wort mit einem \index{} zu versehen, sind 11 Seiten
schon ziemlich lang.
> Außerdem schreibst du oben, alle vorkommenden
> Wörter sollen indexiert werden, und hier willst du nun, dass alle
> überflüssigen Wörter aus dem Index gelöscht werden sollen. Welche
> Wörter sind denn überflüssig? Wie soll ein Rechner oder ein Programm
> das wissen?
Vom Prinzip könnte das so funktionieren wie mit \DoNotIndex{}
von doc. Also defaultmäßig wird jedes Wort indiziert, und man
gibt an, welche nicht zu indizieren sind.
(Natürlich sollte nur in den grichischen Passagen automatisch
alles indiziert werden.)
Paul
> "Christoph Bier" skribis:
[...]
>> Hat der zu indizierende Text nun elf Seiten, wie du oben schreibst,
>> oder ist er »lang«?
>
> Naja, um jedes Wort mit einem \index{} zu versehen, sind 11 Seiten
> schon ziemlich lang.
Dann schon. Aber bis eben erschloss sich mir der Sinn eines solchen
Vorhabens nicht. -- Horizont erweitert. Danke auch an Philipp (und
Wikipedia, das mich über »Editionen« aufklärte).
Hat zwar jetzt mit Tex nix mehr zu tun, aber in Perl sind das doch höchstens
5 Zeilen, oder?
Viele Grüße,
Sebastian
Etwas OT, aber schau Dir doch mal
http://www.perseus.tufts.edu/cgi-bin/morphindex?lang=greek an.
Wenn das nicht reicht, die Leute von Perseus einfach mal anschreiben. Die
sind sehr nett und kooperativ ;).
Viele Grüße,
Sebastian
Hi,
>> Naja, um jedes Wort mit einem \index{} zu versehen, sind 11 Seiten
>> schon ziemlich lang.
>
> Hat zwar jetzt mit Tex nix mehr zu tun, aber in Perl sind das doch höchstens
> 5 Zeilen, oder?
Ich würde einen anderen Weg gehen.
1) alle Worte in eine eigene Datei schreiben
2) überflüssigen Wörter entfernen
3) http://www.iit.upcomillas.es/~oscar/ixgen/
Nur so als Idee.
Ciao,
Uwe
--
www.Uwe-Bieling.de
Alkohol konserviert alles, ausgenommen Würde und Geheimnisse. (R.Lembke)
Was soll mir Perseus dabei helfen?
> Viele Grüße,
> Sebastian
"Henri" <archae...@gmx.at> writes:
> ich habe folgendes Problem: Ich soll für meine Magisterarbeit einen
> griechischen Text (11 Seite, Schriftart Greek, Word-Dokument)
> bearbeiten.
>
> Am Ende soll sich eine Wortliste aller im Text vorkommenden Wörter
> befinden, mit Seiten- bzw. am besten Zeilenverweis zur Inschrift, in
> der das Wort vorkommt.
>
> Es sollte auch noch möglich sein, in diesem Index nachträglich
> Anmerkungen anzufügen (z.B. Verweise auf weitere Textstellen,
> Übersetzungen u.dergl.).
Bei Verwendung des Reftex-Modes für Emacs ist es möglich, eine
Konkordanzdatei zu erstellen.
Eine solche Konkordanzdatei hat folgenden Aufbau:
i gehen
i geht gehen
i ging gehen
i Saturn Planet && Sonnensystem
i Müller Müller, Wolfgang || Müller, Richard
»i« gibt dabei den zu verwendenden Indexbefehl an (Standard ist
\index{}, es ist aber auch möglich, eigene Befehle zu definieren; auch
kann eine Konkordanzdatei mehrere alternative Befehle enthalten).
In der obersten Zeile des Beispiels würde das Wort »gehen« in den Index
aufgenommen werden, in der zweiten Zeile würde das Wort »geht« ebenfalls
über »gehen« referenziert werden. Analog die dritte Zeile. In der
vierten Zeile würde der Ausdruck Saturn zwei Indexeinträge: »Planet«
*und* »Sonnensystem« erzeugen; Auftreten von »Müller« hingegen können
hingegen sowohl als »Wolfgang« *oder* als »Richard« aufgenommen werden.
Reftex bietet bequeme Möglichkeiten, Wörter in die Konkordanzdatei zu
übernehmen. Da diese aber auch nur eine Textdatei ist, läßt sie sich
auch automatisch, etwa per Skript, erstellen. Und aus einer TeX-Datei
alle vorkommenen Wörter zu extrahieren, läßt sich in der Tat mit ein
paar Zeilen Shell oder Perl lösen. Das sollte also kein Problem
darstellen.
Inwieweit es fertige Pakete gibt, die auch eine zeilenweise Indizierung
zulassen, weiß ich nicht. In LaTeX ist Zeilennummerierung
prinzipbedingt nicht ganz problemfrei; es muss dazu in heftiger Weise
die Outputroutine verändert werden. Das macht das Paket lineno.sty,
jedoch kann es m. W. bei dessen Verwendung zu Inkompatibilitäten mit
anderen Paketen kommen. Inwieweit lineno.sty einen eigenen
\index-Befehl bereitstellt, weiß ich nicht.
Ein weiteres Paket, dass grundsätzlich für deinen Zweck in Frage käme,
ist ledmac. Dieses Paket ist für den Satz von Kritischen Editionen
erstellt und verfügt auch über Zeilennummerierung. Auch hier weiß ich
nicht, ob ein eigener \index-Befehl bereitgestellt wird.
Ich denke, grundsätzlich sollte es möglich sein, unter Verwendung von
lineno.sty einen entsprechenden \index-Befehl zu programmieren. Bevor
du das in Betracht ziehst, würde ich aber einen Blick auf Context[1]
werfen; es könnte sein, dass das, was du willst, dort einfacher zu
realisieren ist. Ich kenne mich damit aber nicht aus.
Zusammenfassend sage ich, dass die Verwendung eines seitenbasierten
Index mit LaTeX unter Verwendung eines kleinen Shellskripts und Emacs
leicht und schmerzfrei möglich ist. Ein zeilenbasierter Index ist mit
dieser Kombination ebenfalls möglich, würde aber etwas eigenständige
Programmierung erfordern. Evtl. ist dann Context die empfehlenswertere
Alternative.
olli
Footnotes:
[1] http://wiki.contextgarden.net/Main_Page
--
GnuPG-Key: http://www.sopos.org/pgp/olli.asc
GnuPG-Fingerprint: F27A BA8C 1CFB B905 65A8 2544 0F07 B675 9A00 D827
NP: Nothing
> Es sollte auch noch möglich sein, in diesem Index nachträglich
> Anmerkungen anzufügen (z.B. Verweise auf weitere Textstellen,
> Übersetzungen u.dergl.).
Wäre das nicht vielleicht eine Aufgabe für einen kritischen Apparat?
Der Wortindex wäre dann auch deutlich entlastet. Der kritische Apparat
wäre mit dem ledmac-Packet kein Problem. Mit ledmac lassen sich auch
die Zeilen nummerieren und es gibt einen eigenen Index-Befehl, der
Seitenzahl+Zeilennummer in den Index übernimmt.
Aber ich befürchte, um die Indexierung per Hand kommt man bei Latex
nicht herum. (Falls doch würde auch mich die Lösung brennend
interessieren.)
Michael Ott
-----------------
Beispiel für Index und Apparat mit ledmac:
\documentclass[a4paper]{article}
\usepackage[ngerman]{babel}
\usepackage{ledmac,makeidx}
\makeindex
\begin{document}
\firstlinenum{1} % erste nummerierte Zeile
\beginnumbering \pstart \noindent
blabla erste \edindex{erste} Zeile \\
blabla zweite \edindex{zweite} Zeile\\
blabla dritte Zeile\\
blabla vierte Zeile\\
blabla f\"unfte Zeile\\
Zwei M\"anner gingen\edindex{gehen} nach \edtext{Hause}{\Afootnote{Haus
\textit{A}.}}
\pend\endnumbering
\edindex{zweite|seealso{erste}}
\printindex
\end{document}
Aha. Das heißt, Du brauchst gar keinen Index, der auf Seiten und Zeilen
Deiner Arbeit verweist, sondern einen, der auf laufende Nummer und
Zeilennummer innerhalb eines kleinen Textstücks verweist?
Wie gesagt OT, aber weiter oben kam der Vorschlag (und ich hatte
verstanden, dass Du das so machen willst) nur jeweils das Lemma und
nicht die flektierten Formen aufzunehmen. Und genau dabei kann Dir
Perseus helfen, weil die das für Griechisch und Latein automatisiert können.
Aber das war nur ein Denkanstoß, der nicht wirklich was mit Tex zu tun
hat, sondern eher ein Schritt davor sein könnte.
Viele Grüße,
Sebastian
On 2006-11-13, Henri wrote:
> Am Ende soll sich eine Wortliste aller im Text vorkommenden Wörter
> befinden, mit Seiten- bzw. am besten Zeilenverweis zur Inschrift, in
> der das Wort vorkommt.
vielleicht hilft dir http://lo-f.at/projekte/idxtool.html
HTH
Michael
> vielleicht hilft dir http://lo-f.at/projekte/idxtool.html
das ist ja sehr praktisch... Gibt es einen Trick, mit dem man auch
Wörter, die in \emph{} oder \enquote{} bzw. \footnote{} Anweisungen
stehen indiziert bekommt? Das funktioniert leider nicht automatisch.
Dank und Gruss,
Andreas