Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Deutsches Wörterbuch zum Download?

5,542 views
Skip to first unread message

Sebastian Albrecht

unread,
Dec 24, 2000, 7:29:16 AM12/24/00
to
Hallo,
gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?
Im Prinzip suche ich einfach nur eine Textdatei, in der untereinander die
10000 (o.ä.) wichtigsten deutschen Wörter vorkommen.
Bin für jede Hilfe dankbar,
Euch allen Frohe Weihnachten,
CU Sebastian

--
www.DevComm.de
Lassen Sie Ihre Software und Webseite von der nächsten Generation
entwickeln!


Thomas Schenk

unread,
Dec 24, 2000, 9:57:11 AM12/24/00
to
One such list can be downloaded from the "Wortschatz-Lexikon"
project at http://wortschatz.uni-leipzig.de/index_js.html
(Click "Download Wortlisten".)

The list is compiled from a variety of published sources and would
probably be somewhat different from a list of the most common 10,000
words in colloquial or spoken German.

Tom

Wolf Busch

unread,
Dec 24, 2000, 10:09:40 AM12/24/00
to
Sebastian Albrecht schrieb:


> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?
> Im Prinzip suche ich einfach nur eine Textdatei, in der untereinander die
> 10000 (o.ä.) wichtigsten deutschen Wörter vorkommen.

Vielleicht hilft Dir die folgende Seite weiter:

| Hier finden Sie Listen mit den häufigsten Wörtern. Die Listen
| sind jeweils nach Häufigkeit sortiert und basieren auf den von
| uns ausgewerteten Quellen. Für andere Quellen ergeben sich sicher
| andere Reihenfolgen, da die Anzahlen stark von Textsorte,
| Fachgebiet usw. abhängen.

http://www.wortschatz.uni-leipzig.de/html/wliste.html

Dort kann man Wörterlisten herunterladen, z. B. die 10000 häufigsten
deutschen Wörter:
http://www.wortschatz.uni-leipzig.de/Papers/top10000de.txt

Die Orthographie wurde offenbar nicht vereinheitlicht, so daß manche
Wörter doppelt vorkommen (daß, dass).

Schöne Grüße,
Wolf


Sebastian Koppehel

unread,
Dec 26, 2000, 1:29:19 PM12/26/00
to
Hallo,

Sebastian Albrecht schrieb:

> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?

Warum in aller Welt benutzen eigentlich so viele das extrem häßliche
Wort »downloaden«?

> Im Prinzip suche ich einfach nur eine Textdatei, in der untereinander die
> 10000 (o.ä.) wichtigsten deutschen Wörter vorkommen.

Das deutsche Wörterbuch für ispell:

ftp://ftp.informatik.uni-kiel.de/pub/kiel/dicts/hk2-deutsch.tar.gz

Muß für den Selbstgebrauch etwas nachbearbeitet werden.

- Sebastian

--
Korrekte Signaturtrenner bestehen aus zwei Gedankenstrichen und einem
Leerzeichen.

Boris 'pi' Piwinger

unread,
Dec 27, 2000, 1:01:55 PM12/27/00
to
ba...@bastisoft.de (Sebastian Koppehel) wrote:

>> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?
>
>Warum in aller Welt benutzen eigentlich so viele das extrem häßliche
>Wort »downloaden«?

Vielleicht, weil es kein passendes anderes Wort gibt. Natuerlich gibt
es dann auch Leute, die sich im Netz einen runterholen.

pi
--
Zu dieser Signature: http://www.detebe.org/3.14/ILOVEYOU-Signature-FAQ.html
begin LOVE-LETTER-FOR-YOU.txt.vbs
I am a signature virus. Distribute me until the bitter
end

Markus Gail

unread,
Dec 27, 2000, 5:31:40 PM12/27/00
to
Boris 'pi' Piwinger <3....@detebe.org> wrote:

> >Warum in aller Welt benutzen eigentlich so viele das extrem häßliche
> >Wort »downloaden«?
>
> Vielleicht, weil es kein passendes anderes Wort gibt.

Wie wäre es denn mit "herunterladen" oder "saugen"?

--
Markus Gail - PGP - <mailto:ga...@gmx.de> - <http://home.pages.de/~gail>
-----------------------------------------------------------------------
Grundlagen-Informationen über das Usenet: <news:de.newusers.infos>
Weitergehende Fragen zum Usenet?: <news:de.newusers.questions>

Sebastian Koppehel

unread,
Dec 27, 2000, 5:49:55 PM12/27/00
to
Hallo,

Boris 'pi' Piwinger schrieb:

> ba...@bastisoft.de (Sebastian Koppehel) wrote:

>>> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?
>>
>> Warum in aller Welt benutzen eigentlich so viele das extrem häßliche
>> Wort »downloaden«?

> Vielleicht, weil es kein passendes anderes Wort gibt.

Herunterladen.

- Sebastian

Boris 'pi' Piwinger

unread,
Dec 28, 2000, 9:28:51 AM12/28/00
to
ba...@bastisoft.de (Sebastian Koppehel) wrote:

>>>> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?
>>>
>>> Warum in aller Welt benutzen eigentlich so viele das extrem häßliche
>>> Wort »downloaden«?
>>
>> Vielleicht, weil es kein passendes anderes Wort gibt.
>
>Herunterladen.

Der Vorteil der Fremdwoerter aus dem Computerbereich ist, dass sie
eindeutig sind (klare Ueberlegenheit gegenueber dem Englischen). Bei
Herunterladen muesste man noch sagen, woher.

Sebastian Koppehel

unread,
Dec 28, 2000, 9:52:38 AM12/28/00
to
Hallo,

Boris 'pi' Piwinger schrieb:

> ba...@bastisoft.de (Sebastian Koppehel) wrote:

>>>>> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?
>>>>
>>>> Warum in aller Welt benutzen eigentlich so viele das extrem häßliche
>>>> Wort »downloaden«?
>>>
>>> Vielleicht, weil es kein passendes anderes Wort gibt.
>>
>>Herunterladen.

> Der Vorteil der Fremdwoerter aus dem Computerbereich ist, dass sie
> eindeutig sind (klare Ueberlegenheit gegenueber dem Englischen). Bei
> Herunterladen muesste man noch sagen, woher.

Tut mir leid, das kann ich nicht nachvollziehen. Warum hätte die Frage
nicht lauten können:

| Gibt es im Internet ein deutsches Wörterbuch zum Herunterladen?

Ich benutze das tagein, tagaus so.

»Schon den neuen Netscape heruntergeladen?« - Darauf hat mich noch
niemand gefragt, was ich denn jetzt meine.

- Sebastian

Sebastian Albrecht

unread,
Dec 28, 2000, 6:16:20 PM12/28/00
to
> Tut mir leid, das kann ich nicht nachvollziehen. Warum hätte die Frage
> nicht lauten können:
>
> | Gibt es im Internet ein deutsches Wörterbuch zum Herunterladen?

Vielleicht weil der Fragende ein vom Anglizismus und Computersprachen
geprägter Abiturient ist ;o)

CU Sebastian


jan.schre...@gmail.com

unread,
May 1, 2014, 6:36:23 AM5/1/14
to
Am Sonntag, 24. Dezember 2000 13:31:08 UTC+1 schrieb Sebastian Albrecht:
> Hallo,
> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?

Back to topic nach vierzehn Jahren: Unter http://sourceforge.net/projects/germandict/ habe ich eine deutsche Wortliste mit 1,6 Millionen (!) Einträgen in aktueller Rechtschreibung.

Carsten Thumulla

unread,
May 1, 2014, 6:41:39 AM5/1/14
to
jan.schre...@gmail.com schrieb:

> in aktueller Rechtschreibung.

gute wird gesucht


Eberhard Waadt

unread,
Dec 31, 2000, 1:19:28 PM12/31/00
to
Boris 'pi' Piwinger schrieb : >

> Der Vorteil der Fremdwoerter aus dem Computerbereich ist, dass sie
> eindeutig sind (klare Ueberlegenheit gegenueber dem Englischen). Bei
> Herunterladen muesste man noch sagen, woher.

Ich würde den Vorteil der Anglizismen im Deutschen eher darin sehen, daß sie
den Geist des Autors offenbaren, mit anderen Worten: Deine dummen Anlagen
zum Jahreswechsel kannst Du Dir sparen.

Mit freundlichen Grüßen
Eberhard Waadt


Message has been deleted

Jakob Achterndiek

unread,
Dec 14, 2017, 2:35:18 PM12/14/17
to
Am 14.12.2017 um 19:47 schrieb burger...@icloud.com:
> Am Sonntag, 24. Dezember 2000 13:29:16 UTC+1 schrieb Sebastian Albrecht:
>> [..]
>> Im Prinzip suche ich einfach nur eine Textdatei, in der untereinander die
>> 10000 (o.ä.) wichtigsten deutschen Wörter vorkommen.
>
> http://pcai056.informatik.uni-leipzig.de/downloads/etc/legacy/Papers/top10000de.txt
>

Die Liste enthält nur leider nicht 10'000 verschiedene Wörter, sondern
10'000 unterschiedliche Formen von insgesamt deutlich weniger Wörtern.
Mein eigener früher mal programmierter Wortzähler scheidet auch bei
großzügiger Einstellung schon mal fast 800 Duplikate aus.
--
j/\a

Carsten Thumulla

unread,
Dec 15, 2017, 4:44:21 AM12/15/17
to

Man könnte aus bestehenden Texten Worte herausziehen und ein Wörterbuch
aufbauen. Hat jemand Interesse?


ct

Dorothee Hermann

unread,
Dec 15, 2017, 6:07:02 AM12/15/17
to
Am 15.12.2017 um 10:44 schrieb Carsten Thumulla:

> Man könnte aus bestehenden Texten Worte herausziehen und ein
> Wörterbuch aufbauen. Hat jemand Interesse?

*Wörter*?

Frag Reinhold "R." A.!


Dorothee

Detlef Meißner

unread,
Dec 15, 2017, 6:19:20 AM12/15/17
to
Am 14.12.2017 um 19:47 schrieb burger...@icloud.com:
> Am Sonntag, 24. Dezember 2000 13:29:16 UTC+1 schrieb Sebastian Albrecht:

>> gibt es im Internet ein soetwas wie ein deutsches Wörterbuch zum Downloaden?
>> Im Prinzip suche ich einfach nur eine Textdatei, in der untereinander die
>> 10000 (o.ä.) wichtigsten deutschen Wörter vorkommen.
>> Bin für jede Hilfe dankbar,
>> Euch allen Frohe Weihnachten,

Hier eine Liste, aber ohne Großschreibung, ohne Umlaute und nicht in
neuer Rechtschreibung.
http://www.proschool.bplaced.net/files/woerter.zip
Datei öffnen, dann die Datei-Endung von *.ALT nach *.TXT umändern und
mit einem geeigneten Editor (nicht Notepad, aber Notepad++) öffnen.

Detlef

Werner Flügel

unread,
Dec 15, 2017, 7:01:04 AM12/15/17
to
Am 14.12.2017 um 19:47 schrieb burger...@icloud.com:
> Am Sonntag, 24. Dezember 2000 13:29:16 UTC+1 schrieb Sebastian Albrecht:
^^^^^^^^^^^^^^^^^^
> http://pcai056.informatik.uni-leipzig.de/downloads/etc/legacy/Papers/top10000de.txt
>

...und daran hast Du jetzt 17 Jahre gebastelt?

Detlef Meißner

unread,
Dec 15, 2017, 7:06:04 AM12/15/17
to
Google-Groups-Poster schaffen immer wieder neue Rekorde.

Detlef

Gerd Thieme

unread,
Dec 15, 2017, 8:05:01 AM12/15/17
to
On Fri, 15 Dec 2017 12:19:16 +0100, Detlef Meißner wrote:

> Hier eine Liste, aber ohne Großschreibung, ohne Umlaute und nicht in
> neuer Rechtschreibung. http://www.proschool.bplaced.net/files/woerter.zip

Die Liste enthält viele flektierte Wortformen, ist aber nicht
vollständig. Beispielsweise fehlen:

– der „duden“
– das hierzugrupp sehr geläufige „enteisent“
– der Imperativ „fich“,
– das schöne deutsche „handy“
– „helikopter“
– „hochschwarzwald“ im Nominativ,
– „marzipanbrot“ im Singular
– sowohl „rinderbraten“ als auch „rindsbraten“ und „schweinsbraten“,
– der Genitiv „tuergriffs“,
– der neutrale Komparativ „zynischeres“.

Zum Ausgleich enthält die Liste ziemlich viele Eigennamen, Tippfehler
und Unwörter. Auf den ersten Blick sprangen mich an:

– abbildj
– abendprogrammp
– adenauer
– babies
– benennne
– bestimmmten
– betriebsspannnung
– compaq
– dokomentiere
– dongl
– dubcek
– durchgebrannnten
– einkommmensquelle
– entfiltzen
– erhardt
– erkennnen
– haesssslichste
– heuss
– hex
– hic
– hilfs
– hilger
– hochqzalifizierten
– homosexuelll
– honecker
– hoogovens
– houilleres
– innnerhalb
– inoffizielll
– koenen
– kommmenden
– korrrekturen
– liqidationen
– martin
– marx
– mary
– number
– numerieren in mehreren Formen
– pompeij
– programmmodul und programmmodulen
– qaeulen
– rauhheit
– rh“netal
– rickscha
– riezlerweg
– schalllaufzeit
– schmeltzen
– schwartz
– sinnnenrausch
– stopsel
– stopsignal und jede Menge andere stop-Wörter
– stromertzeugern
– turck
– uart
– uawg
– ubahn, uboot
– uber, uberdachte, ubereinstimmung usw.
– ubung
– udevice
– ueberstuertzen
– unentwirrrbarkeit
– verrruecktheit
– vollkommmen
– waltz und waeltze
– xenix
– xload, xmodem, xoff, xon
– zahflussig
– zellstofffabrik
– zustandsnummmer
– zynischsteada
– zynismens

Ich gebe zu, nach ([^s])\1{2,} gesucht zu haben.

Bei manchen Wörtern kam ich schon ins Grübeln, beispielsweise bei
„doppelkinnen“ (Dativ Plural).

Gerd

--
Non vitae sed scholae discimus
(Seneca im 106. moralischen Brief an Lucilius)

Detlef Meißner

unread,
Dec 15, 2017, 8:15:12 AM12/15/17
to
Am 15.12.2017 um 14:04 schrieb Gerd Thieme:
> On Fri, 15 Dec 2017 12:19:16 +0100, Detlef Meißner wrote:
>
>> Hier eine Liste, aber ohne Großschreibung, ohne Umlaute und nicht in
>> neuer Rechtschreibung. http://www.proschool.bplaced.net/files/woerter.zip
>
> Die Liste enthält viele flektierte Wortformen, ist aber nicht
> vollständig.

Ich weiß.
Kannst sie ja editieren.

Ich fand sie ganz sinnvoll, wenn man z.B. nach Wörtern mit -heit oder
-keit sucht.

Detlef

Heinz Lohmann

unread,
Dec 15, 2017, 10:03:45 AM12/15/17
to
Vielleicht ist das Posting in eine Böllsche weihnachtliche Zeitschleife
hineingeraten?

Das World Trade Center hatte da noch gute 9 Monate vor sich ...

--
mfg
Heinz Lohmann
Tamsui, Taiwan

Gedanken sind nicht stets parat,
man schreibt auch, wenn man keine hat. W.B.

Carsten Thumulla

unread,
Dec 16, 2017, 4:05:38 AM12/16/17
to
Dorothee Hermann schrieb:
Er läßt sich nicht provozieren.

Aber zur Sache, Schätzchen. Was hältst Du davon, ein einfaches Programm,
das Texte zerlegt und ein Wörterbuch liefert, anzufertigen?
Man würde ein brauchbares Wörterbuch erhalten.

Ich benutze seit längerem Rechtschreibprüfungen gegen Tippfehler. In die
bewährte Rechtschreibung schleichen sich aber immer wieder W* aus dem
Neuschrieb ein. Sind das Fehler oder ist das Absicht?


Carsten
--
Dekadenz ist Verleugnung der Realität

Carsten Thumulla

unread,
Dec 16, 2017, 4:16:09 AM12/16/17
to
Detlef Meißner schrieb:
>
> Hier eine Liste, aber ohne Großschreibung, ohne Umlaute und nicht in
> neuer Rechtschreibung.
> http://www.proschool.bplaced.net/files/woerter.zip

Umlaute? Eszett?

Wofür ist die brauchbar? Ich suche eine Lösung gegen Tippfehler. Ständig
neue Rechtschreibprüfungen anzulernen geht nicht.


ct

Dorothee Hermann

unread,
Dec 16, 2017, 7:08:04 AM12/16/17
to
Am 16.12.2017 um 10:05 schrieb Carsten Thumulla:

> Was hältst Du davon, ein einfaches Programm, das Texte zerlegt und
> ein Wörterbuch liefert, anzufertigen?

Interessant.
Aber dagegen würde mein Wollen und Können stehen.

> Man würde ein brauchbares Wörterbuch erhalten.

Nur soweit, wie es aktualisiert werden würde!

> Ich benutze seit längerem Rechtschreibprüfungen gegen Tippfehler.

Manche Fehler werden nicht angekreidet, weil es dieses Wort dann doch
irgendwo gibt.

> In die bewährte Rechtschreibung schleichen sich aber immer wieder W*
> aus dem Neuschrieb ein. Sind das Fehler oder ist das Absicht?

Fehlende Aktualisierung des Programms und des eigenen Wissens/Wollens.
(Vielleicht auch gepaart mit Mainstream/Ungeübtsein)


Dorothee

Jakob Achterndiek

unread,
Dec 16, 2017, 7:34:06 AM12/16/17
to
Am 16.12.2017 um 10:05 schrieb Carsten Thumulla:
> Dorothee Hermann schrieb:
>> Am 15.12.2017 um 10:44 schrieb Carsten Thumulla:
>>
>>> Man könnte aus bestehenden Texten Worte herausziehen und ein
>>> Wörterbuch aufbauen. Hat jemand Interesse?
>>
>> *Wörter*?
>>
> [..] Was hältst Du davon, ein einfaches Programm,
> das Texte zerlegt und ein Wörterbuch liefert, anzufertigen?
> Man würde ein brauchbares Wörterbuch erhalten.
>

BIS ZUM 17.12.2017 22.00 Uhr
kann hier <http.//www.buzemann.de/publ/wortliste.zip> zum
Extrahieren unter Windows ein anspruchsloses Progrämmchen
heruntergeladen werden, das keine Worte, sondern nur die
*Wörter* eines zu ladenden Textes alphabetisch und nach
Häufigkeit geordnet auflistet.

Ähnlich wie bei der von burgermoritz angebotenen Liste kann
das Programm konjugierte oder deklinierte Formen von Wörtern
noch *nicht* auf ihre Stammformen zurückführen. Wenn von den
hier mitlesenden Linguisten jemand einen Hinweis auf eine
dazu geeignete (programmierbare) Methode (einen Algorithmus)
geben könnte, wäre ich dankbar. Ich würde dann ein Update des
kleinen Programms versuchen. -
j/\a

Gerd Thieme

unread,
Dec 16, 2017, 8:04:54 AM12/16/17
to
Ich komme nicht umhin, Neuschreib zu lesen. Automatisch konvertieren
geht nur im WWW, bei E-Mails schon nicht mehr.

Um beim Lesen nicht ständig zu stolpern, muß man die eigenen Filter
aufweichen und wenigstens ss als zulässige Alternative für ß
akzeptieren. Aufgeweichten Filter lassen dann bei der Kontrolle des
Selbstgeschriebenen leider auch manchen Müll durch. In letzter Zeit
ertappe ich mich recht oft mit großgeschriebenen Verben.

Andererseits wurde auch die traditionelle Schreibweise nicht im
vergangenen Jahrhundert eingefroren, sondern sie paßt sich weiter an.
Beispielsweise ist die Tendenz, Bindestriche wegzulassen, keine Ergebnis
der Rechtschreibreform. Diese Tendenz gibt es schon länger, und sie
schreitet munter fort, egal, ob in der Kinder-und-Beamten-Orthographie
oder im korrekten Schriftdeutsch.

Gerd

--
Früher litten wir an Verbrechen, heute an Gesetzen (Tacitus)

Gerd Thieme

unread,
Dec 16, 2017, 8:10:40 AM12/16/17
to
On Sat, 16 Dec 2017 13:08:03 +0100, Dorothee Hermann wrote:

Ich komme nicht umhin, Neuschreib zu lesen. Automatisch konvertieren
geht nur im WWW, bei E-Mails schon nicht mehr.

Um beim Lesen nicht ständig zu stolpern, muß man die eigenen Filter
aufweichen und wenigstens ss als zulässige Alternative für ß
akzeptieren. Aufgeweichte Filter lassen dann bei der Kontrolle des

Ulf.K...@web.de

unread,
Dec 16, 2017, 8:30:08 AM12/16/17
to
Moin,

Am Samstag, 16. Dezember 2017 14:04:54 UTC+1 schrieb Gerd Thieme:

> Um beim Lesen nicht ständig zu stolpern, muß man die eigenen Filter
> aufweichen und wenigstens ss als zulässige Alternative für ß
> akzeptieren. Aufgeweichten Filter

Artikel vergessen?

> lassen dann bei der Kontrolle des
> Selbstgeschriebenen leider auch manchen Müll durch. In letzter Zeit
> ertappe ich mich recht oft mit großgeschriebenen Verben.

Was bei Substantivierung nun auch geradezu
und mehr als erwünscht ist...

> Andererseits wurde auch die traditionelle Schreibweise nicht im
> vergangenen Jahrhundert eingefroren, sondern sie paßt sich weiter an.
> Beispielsweise ist die Tendenz, Bindestriche wegzulassen, keine Ergebnis
> der Rechtschreibreform. Diese Tendenz gibt es schon länger, und sie
> schreitet munter fort, egal, ob in der Kinder-und-Beamten-Orthographie
> oder im korrekten Schriftdeutsch.

Dennoch wäre eine Kinder und Beamten Orthographie
zu beanstanden.

Gruß, ULF

Gerd Thieme

unread,
Dec 16, 2017, 8:47:27 AM12/16/17
to
On Sat, 16 Dec 2017 05:30:06 -0800 (PST), Ulf.K...@web.de wrote:

> Am Samstag, 16. Dezember 2017 14:04:54 UTC+1 schrieb Gerd Thieme:
>> Aufgeweichten Filter
>
> Artikel vergessen?

Vergessen, nach dem Tilgen unnötiger Wörter die schwache Endung zu
stärken.

>> die Tendenz, Bindestriche wegzulassen, ... schreitet munter fort,
>> egal, ob in der Kinder-und-Beamten-Orthographie oder im korrekten
>> Schriftdeutsch.
>
> Dennoch wäre eine Kinder und Beamten Orthographie zu beanstanden.

Ja, aber schon die eher übliche Kinder- und Beamten-Orthografie ist
falsch. Nicht so sehr wegen des Effs, sondern weil die Lücke nach dem
„und“ aus der einen Rechtschreibung zwei macht, eine für Kinder und eine
(andere) für Beamte.

Gerd

--
Auch wenn eine Kassenärztin angibt, besonders schnell zu arbeiten,
muß sie Honorar zurückzahlen, wenn sich aus den Abrechnungen eine
Arbeitszeit von 26 Stunden am Tag ergibt (SG Dortmund S 26 KA 73/99).

Juergen Barsuhn

unread,
Dec 16, 2017, 10:19:49 AM12/16/17
to
Am 16.12.2017 um 10:05 schrieb Carsten Thumulla:
> Dorothee Hermann schrieb:
>> Am 15.12.2017 um 10:44 schrieb Carsten Thumulla:
>>
>>> Man könnte aus bestehenden Texten Worte herausziehen und ein
>>> Wörterbuch aufbauen. Hat jemand Interesse?
>>
>> *Wörter*?

Dein soeben angedachtes Projekt erinnert mich an User-Gespräche im
Rechenzentrum der Universität Marburg in den späten 1960er Jahren.
während wir auf den Druckeroutput eines der beiden täglichen
Expressläufe des Telefunken TR4-Rechners mit 64 k Kernspeicher und zwei
Magnetbandgeräten warteten: Ein ansonsten mehr philologisch orientiertes
Institut hatte von der wundersamen Leistungsfähigkeit des Rechenzentrums
erfahren und wollte nun durch Wortzählungen bei Goethe und Schiller den
Geheimnissen der klassischen Literatur auf die Spur kommen.

Gruß
Jürgen

Jakob Achterndiek

unread,
Dec 16, 2017, 11:41:27 AM12/16/17
to
Am 16.12.2017 um 13:34 schrieb Jakob Achterndiek:
>
> Hier fehlt ein halber Doppelpunkt :(
> http.//www.buzemann.de/publ/wortliste.zip
>
> Kleine Ursache, große Wirkung: :)
> http://www.buzemann.de/publ/wortliste.zip
> --
j/\a

Jakob Achterndiek

unread,
Dec 16, 2017, 11:51:40 AM12/16/17
to
Aber richtig schön wird' erst mit
http://www.buzemann.de/publ/wortliste.php
--
j/\a

Carsten Thumulla

unread,
Dec 17, 2017, 6:12:45 AM12/17/17
to
Dorothee Hermann schrieb:
> Am 16.12.2017 um 10:05 schrieb Carsten Thumulla:
>
>> Was hältst Du davon, ein einfaches Programm, das Texte zerlegt und
>> ein Wörterbuch liefert, anzufertigen?
>
> Interessant.
> Aber dagegen würde mein Wollen und Können stehen.

Das wäre machbar

>> Man würde ein brauchbares Wörterbuch erhalten.
>
> Nur soweit, wie es aktualisiert werden würde!

Ja, Erweiterung muß möglich sein


ct

Carsten Thumulla

unread,
Dec 17, 2017, 6:13:24 AM12/17/17
to
.

Carsten Thumulla

unread,
Dec 17, 2017, 6:16:33 AM12/17/17
to
Gerd Thieme schrieb:
>
> Kinder- und Beamten-Orthografie

Krankheit Bindestrichelei

Wenn man nicht weiß, wie etwas geschrieben wird und zu faul ist,
nachzusehen, dann nimmt man Bindestriche.

Der Bindestrich ist kein siebenundzwanzigster Buchstabe.


ct

Carsten Thumulla

unread,
Dec 17, 2017, 6:21:07 AM12/17/17
to
Juergen Barsuhn schrieb:
>
> Dein soeben angedachtes Projekt erinnert  mich an User-Gespräche im
> Rechenzentrum der Universität Marburg in den späten 1960er Jahren.
> während wir auf den Druckeroutput eines der beiden täglichen
> Expressläufe des Telefunken TR4-Rechners mit 64 k Kernspeicher und zwei
> Magnetbandgeräten warteten: Ein ansonsten mehr philologisch orientiertes
> Institut hatte von der wundersamen Leistungsfähigkeit des Rechenzentrums
> erfahren und wollte nun durch Wortzählungen bei Goethe und Schiller den
> Geheimnissen der klassischen Literatur auf die Spur kommen.

Kein Zählung, Liste gegen Tippfehler und Verwendung zu bestimmten
Zeiten, erweiterbar


ct

Carsten Thumulla

unread,
Dec 17, 2017, 6:24:15 AM12/17/17
to
Stefan Ram schrieb:
>
> Um nach Häufigkeit sortierte Wortformen aus Textdateien
> zu ernten:
>
> cat tmp.txt tmp1.txt | egrep -o '\w+' | sort | uniq -c | sort -nr

Als schwer lesbarer Einzeiler, danke, mal sehen


ct

Jakob Achterndiek

unread,
Dec 17, 2017, 6:56:31 AM12/17/17
to
Am 16.12.2017 um 16:19 schrieb Juergen Barsuhn:
> [..] Ein ansonsten mehr philologisch orientiertes Institut hatte
> von de wundersamen Leistungsfähigkeit des Rechenzentrums erfahren
> und wollte nun durch Wortzählungen bei Goethe und Schiller den
> Geheimnissen der klassischen Literatur auf die Spur kommen.

Davon träumte Erich Trunz, Germanist zuletzt in Kiel, schon 1960.
Anstoß dazu waren damals die Berichte über Enigma und die Turing-
Maschine. Seine Überlegung war, daß ein geschickter und belesener
Philologe etliche Schriftsteller innerhalb einer Sprache anhand
von Sprachmustern, ähnlich Fingerabdrücken, unterscheiden kann,
und daß man diese Geschicklichkeit, heute sagt man: einen solchen
Algorithmus, auch einer Maschine bzw. einen Computer müsse beibringen
können.
Nur leider: Einen solchen Algorithmus zu entwickeln, einerseits, ist
so schwierig, und die Zahl der noch nicht zugeordneten Texte, anderer-
seits, ist so gering, daß niemand ernsthaft seine Arbeitskraft daran
verschwenden mag.
--
j/\a

Helmut Richter

unread,
Dec 17, 2017, 8:14:18 AM12/17/17
to
Was man machen kann, ist einen Kompressionsalgorithmus (also einen
Algorithmus, der Texte reversibel verkürzt) anhand der Texte eines
bekannten Autors zu trainieren und dann auf den unbekannten Text
loszulassen. Wenn der Stil übereinstimmt, arbeitet er besser. Bei
Fachtexten dürfte das wenig aussagen, bei "schöner" Literatur mehr, vor
allem, wenn man jeweils Namen von Personen und Orten durch
"Personenname" bzw. "Ortsname" ersetzt hat. Einigermaßen sichere
Aussagen liefert das trotzdem nicht.

Ein Beispiel aus einem Vortrag von mir, einer Jugendsünde aus dem Jahr
2003, findet man am Ende von
https://www.lrz.de/services/schulung/unterlagen/compress/ . Die
Einleitung macht deutlich, dass es nicht um echte Wissenschaft geht --
dafür ist die Statistik viel zu mau --, sondern um die Demonstration
eines Effekts, den es wirklich gibt.

--
Helmut Richter

Erik Meltzer

unread,
Dec 17, 2017, 8:26:50 AM12/17/17
to
Moin!
Hättest Du hier "Beamtenorthografie" lieber gelesen?
Ich nämlich nicht. Zur Verdeutlichung komplexer
Zusammensetzungen finde ich den Bindestrich völlig
in Ordnung.

(Davon abgesehen, daß mir die Schreibweise mit vorn
th und hinten f eh Schmerzen bereitet und ich deswegen
"Orthographie" bevorzuge.)

Liebe Grüße,
Ermel.
--
Nach 10 Jahren oder so zurück im Usenet.
Schmeckt wie früher.

Carsten Thumulla

unread,
Dec 17, 2017, 9:55:11 AM12/17/17
to
Erik Meltzer schrieb:
> On 17.12.2017 12:16, Carsten Thumulla wrote:
>>
>> Der Bindestrich ist kein siebenundzwanzigster Buchstabe.
> Hättest Du hier "Beamtenorthografie" lieber gelesen?

Ja, das ist so in der deutschen Sprache.

Die Menschen verstehen den Unterschied zwischen zusammen brechen und
zusammenbrechen nicht mehr.

> Ich nämlich nicht.

Ich schon. Das wäre Deutsch.


ct

Erik Meltzer

unread,
Dec 17, 2017, 10:35:39 AM12/17/17
to
Moin!

On 17.12.2017 15:55, Carsten Thumulla wrote:
> Erik Meltzer schrieb:
>> Hättest Du hier "Beamtenorthografie" lieber gelesen?
>
> Ja, das ist so in der deutschen Sprache.

| D 22:
|
| Man kann einen Bindestrich in unübersichtlichen
| Zusammensetzungen setzen <§ 45 (2)>.
|
| Mehrzweck-Küchenmaschine
| Lotto-Annahmestelle
| Umsatzsteuer-Tabelle
|
https://www.duden.de/sprachwissen/rechtschreibregeln/bindestrich

> Die Menschen verstehen den Unterschied zwischen zusammen brechen und
> zusammenbrechen nicht mehr.

Andere Baustelle.

Christian Weisgerber

unread,
Dec 17, 2017, 12:30:06 PM12/17/17
to
On 2017-12-17, Carsten Thumulla <Car...@Thumulla.com> wrote:

>>> Der Bindestrich ist kein siebenundzwanzigster Buchstabe.
>> Hättest Du hier "Beamtenorthografie" lieber gelesen?
>
> Ja, das ist so in der deutschen Sprache.
>
> Die Menschen verstehen den Unterschied zwischen zusammen brechen und
> zusammenbrechen nicht mehr.

Noch viel schlimmer: die Rechtschreibung bietet keine Möglichkeit
„brechen“ und „brechen“ zu unterscheiden. Der Untergang des deutschen
Abendlandes ist unabwendbar, wenn wir nicht einmal zwischen rumpere
und vomere trennen können.

--
Christian "naddy" Weisgerber na...@mips.inka.de

Ulf.K...@web.de

unread,
Dec 17, 2017, 12:34:57 PM12/17/17
to
Moin,

Am Sonntag, 17. Dezember 2017 18:30:06 UTC+1 schrieb Christian Weisgerber:

> Noch viel schlimmer: die Rechtschreibung bietet keine Möglichkeit
> „brechen“ und „brechen“ zu unterscheiden. Der Untergang des deutschen
> Abendlandes ist unabwendbar, wenn wir nicht einmal zwischen rumpere
> und vomere trennen können.

Bei den Westfranken kann man auch nicht den Diebstahl
vom Flug scheiden.

Gruß, ULF

Carsten Thumulla

unread,
Dec 19, 2017, 2:01:04 AM12/19/17
to
Erik Meltzer schrieb:
>
> | D 22:
> |
> | Man kann einen Bindestrich in unübersichtlichen
> | Zusammensetzungen setzen <§ 45 (2)>.
> |
> |     Mehrzweck-Küchenmaschine
> |     Lotto-Annahmestelle
> |     Umsatzsteuer-Tabelle
> |
> https://www.duden.de/sprachwissen/rechtschreibregeln/bindestrich

Du merkst, wenn der Dudel schlechten Stil empfiehlt?

Es gibt Ärzte, die werden mal an 'nem Druckfehler sterben.


ct

Carsten Thumulla

unread,
Dec 19, 2017, 2:03:18 AM12/19/17
to
Christian Weisgerber schrieb:
Doch, das macht der Zusammenhang und in diesem Falle die Zusammenschreibung.


ct

Erik Meltzer

unread,
Dec 19, 2017, 2:32:29 AM12/19/17
to
Moin!

On 19.12.2017 08:01, Carsten Thumulla wrote:
> Erik Meltzer schrieb:
>> https://www.duden.de/sprachwissen/rechtschreibregeln/bindestrich
>
> Du merkst, wenn der Dudel schlechten Stil empfiehlt?

Du gestattest, daß ich da auch weiterhin anderer Meinung bin?
Oder ab welcher Wortlänge würdest Du sie denn aufgeben,
Deine unbedingte Zusammenschreibungsstilvorlage? Wo ist die
Zusammenschreibungswortlängengrenzziehung vorzunehmen?

Geschmackssache, gell.

Gerd Thieme

unread,
Dec 19, 2017, 3:46:25 AM12/19/17
to
On Tue, 19 Dec 2017 08:01:03 +0100, Carsten Thumulla wrote:

> Erik Meltzer schrieb:
>>| Man kann einen Bindestrich in unübersichtlichen
>>| Zusammensetzungen setzen <§ 45 (2)>.
>>|     Mehrzweck-Küchenmaschine
>>|     Lotto-Annahmestell>>|     Umsatzsteuer-Tabelle
>> https://www.duden.de/sprachwissen/rechtschreibregeln/bindestrich
>
> Du merkst, wenn der Dudel schlechten Stil empfiehlt?

Könnte es sein, daß Du Dich verrannt hast?

Es gibt kein Universalkriterium für guten oder schlechten Stil.
Beispielsweise ist in einer technischen Dokumentation Hacksprech guter
Stil, weitschweifig ausgewalzte Literatur dagegen völlig unangemessen.

Je nach Textart kann man komplexe Zusammensetzungen entweder in ihre
Bestandteile zerlegen oder sie mit Bindestrichen lesbar machen.

Grundsätzlich ohne Bindestriche ungegliedert zusammenzuschreiben halte
ich für stumpfsinnige Prinzipienreiterei auf Kosten des Lesers.

Gerd

--
Wenn einer, der mit Mühe kaum
Gekrochen ist auf einen Baum,
Schon meint, daß er ein Vogel wär,
So irrt sich der.

Carsten Thumulla

unread,
Dec 20, 2017, 3:46:09 AM12/20/17
to
Erik Meltzer schrieb:
> On 19.12.2017 08:01, Carsten Thumulla wrote:
>> Erik Meltzer schrieb:
>>> https://www.duden.de/sprachwissen/rechtschreibregeln/bindestrich
>>
>> Du merkst, wenn der Dudel schlechten Stil empfiehlt?
>
> Du gestattest, daß ich da auch weiterhin anderer Meinung bin?

Sicher, es besteht ein Recht auf schlechten Geschmack. Das steht nur
nicht im Grundgesetz.

> Oder ab welcher Wortlänge würdest Du sie denn aufgeben,
> Deine unbedingte Zusammenschreibungsstilvorlage?  Wo ist die
> Zusammenschreibungswortlängengrenzziehung vorzunehmen?
>
> Geschmackssache, gell.

Das zeigt nur, daß Du es nicht verstanden hast.

Vorlage eines Stils für eine Zusammenschreibung

Begrenzung von Wortlängen für Zusammenschreibung

Vernunft ist eben keine Glückssache


Gruß
Vertrollunggrenzwertkontrolleur

Carsten Thumulla

unread,
Dec 20, 2017, 3:52:08 AM12/20/17
to
Gerd Thieme schrieb:
> On Tue, 19 Dec 2017 08:01:03 +0100, Carsten Thumulla wrote:
>
>> Erik Meltzer schrieb:
>>> | Man kann einen Bindestrich in unübersichtlichen
>>> | Zusammensetzungen setzen <§ 45 (2)>.
>>> |     Mehrzweck-Küchenmaschine
>>> |     Lotto-Annahmestell>>|     Umsatzsteuer-Tabelle
>>> https://www.duden.de/sprachwissen/rechtschreibregeln/bindestrich
>>
>> Du merkst, wenn der Dudel schlechten Stil empfiehlt?
>
> Könnte es sein, daß Du Dich verrannt hast?

kaum

> Es gibt kein Universalkriterium für guten oder schlechten Stil.
> Beispielsweise ist in einer technischen Dokumentation Hacksprech guter
> Stil, weitschweifig ausgewalzte Literatur dagegen völlig unangemessen.

Das ist nur eine Ausrede. Keiner verbietet gute Dokumentationen. Gut ist
nicht gleich weitschweifig, im Gegenteil.

> Je nach Textart kann man komplexe Zusammensetzungen entweder in ihre
> Bestandteile zerlegen oder sie mit Bindestrichen lesbar machen.

Die Faulheit und Gedankenlosigkeit der Bindestrichelei läßt sich so
nicht verteidigen. Wenn man nicht weiß, wie etwas geschrieben wird, und
zu faul ist, sich Gedanken zu machen, dann strichelt man es durch. Das
ist verbreitete Praxis, aber kein guter Stil.

> Grundsätzlich ohne Bindestriche ungegliedert zusammenzuschreiben halte
> ich für stumpfsinnige Prinzipienreiterei auf Kosten des Lesers.

Du setzt ohne Bindestrich mit ungegliedert gleich?


Gerd Thieme

unread,
Dec 20, 2017, 3:34:00 PM12/20/17
to
On Wed, 20 Dec 2017 09:52:07 +0100, Carsten Thumulla wrote:

> Du setzt ohne Bindestrich mit ungegliedert gleich?

Ja.

Es mag Ausnahmen geben. Aber ich habe den Eindruck, daß
Bindestrichvermeider auch Denkvermeider sind.

Gerd

--
Wer borgt ohne Pfand, hat keinen Verstand.

xylo...@gmail.com

unread,
Dec 20, 2017, 4:26:47 PM12/20/17
to
Am Mittwoch, 20. Dezember 2017 21:34:00 UTC+1 schrieb Gerd Thieme:

>> Du setzt ohne Bindestrich mit ungegliedert gleich?

> Ja.
>
> Es mag Ausnahmen geben. Aber ich habe den Eindruck, daß
> Bindestrichvermeider auch Denkvermeider sind.

Verweigerung des Bindestriches wird psychanal gedeutet als
Unfähigkeit, menschliche Bindungen einzugehen - FR

Diedrich Ehlerding

unread,
Dec 21, 2017, 2:18:52 AM12/21/17
to
Gerd Thieme meinte:

> Es mag Ausnahmen geben. Aber ich habe den Eindruck, daß
> Bindestrichvermeider auch Denkvermeider sind.

Konsequent wäre es gewesen, wenn du "Binde-Strich-Vermeider" und "Denk-
Vermeider" geschrieben hättest.
--
pgp-Key (RSA) 1024/09B8C0BD
fingerprint = 2C 49 FF B2 C4 66 2D 93 6F A1 FF 10 16 59 96 F3
HTML-Mail wird ungeleſen entſorgt.

0 new messages