Welche Lizenzform brauchen wir minimal?
Welche Lizenz wäre gut für Nachfolgeprojekte?
Was kann/soll ich vorschlagen, worauf kann ich verweisen?
Links?
Danke schonmal,
Georg
Was soll im Zuge des Projekts überhaupt unter eine Lizenz gestellt werden?
1. Die originale Wortliste?
2. Eine bearbeitete (bereinigte) Wortliste?
3. Eine Wortliste mit Trennungen (jeglicher Art)?
4. Die Trennmuster?
5. (Eventuelle Skripten und die Datenbankanwendung können
natürlich auch dazugezählt werden. Aber die sind nicht
kritisch, da die wohl komplett selbstgebraut sind.)
Haben die Mannheimer (Leipziger, Berliner) ihrerseits Interesse an
unserem Projekt und dessen Ergebnissen?
Viele Grüße
Stephan Hennig
Die bekannteste OpenSource-Lizenz ist sicher die GNU GPL. Mir ist aber
ehrlich gesagt nicht klar, ob sich der strenge »Copy Left«-Anspruch mit
einer Distribution via Lehmanns verträgt. Soll heißen: Blockiert eine
unter GPL gestellte Rohliste evtl. später die kommerzielle Weitergabe
von TeX- bzw. OpenOffice-Distributionen?
Ist diese ganze Softwarelizenzgeschichte überhaupt anwendbar auf reine
Textlisten. Urheberrecht greift hier ja wohl nicht (Stichwort:
Schöpfungshöhe). Wie ist der Anteil der Rohliste an Trennmustern zu
bewerten? (Zugegeben: Ohne Rohliste keine Trennmuster.)
LPPL wäre vermutlich gut, dann könnten wir die Rohdaten unverändert
verteilen, hätten aber recht freie Hand unsere geänderten (verbesserten,
getrennten ...) Versionen frei zu verteilen, so dass auch ein späterer
Gewinn (wie gering er auch immer bei einer Distribution des
Gesamtsystems ausfallen mag) die Lizenzen nicht verletzt.
Gruß, Georg
> Die bekannteste OpenSource-Lizenz ist sicher die GNU GPL. Mir ist aber
> ehrlich gesagt nicht klar, ob sich der strenge »Copy Left«-Anspruch mit
> einer Distribution via Lehmanns verträgt. Soll heißen: Blockiert eine
> unter GPL gestellte Rohliste evtl. später die kommerzielle Weitergabe
> von TeX- bzw. OpenOffice-Distributionen?
Ich denke, nein. Meines Wissens setzt die GPL keine Beschränkungen
bezüglich der Nutzung, sondern der Weitergabe. Du kannst
GPL-lizensierte Werke versuchen zu verkaufen, aber ohne zusätzlichen
Nutzen wird daraus kein erfolgreiches Geschäftsmodell werden. (Jetzt
kann man mal versuchen den zusätzlichen Nutzen der Lehmannschen
TeX-Live-Ausgabe zu identifizieren. Viel Spaß! :)
Bei der Weitergabe ist die GPL wiederum nicht ganz zufällig so
gestrickt, dass abgeleitete Werke ohne Beschränkung im Quellcode
verfügbar sein müssen. Damit können einmal GPL-lizensierte Werke nicht
einfach so in kommerziellen Anwendungen "verschwinden". Alles was auf
GPL-lizensierten Werken aufbaut bleibt für jedermann nutzbar. (Sofern
es für die Öffentlichkeit gedacht ist. Im stillen Kämmerlein darf man
mit GPL-Werken tun, was man will.)
> Ist diese ganze Softwarelizenzgeschichte überhaupt anwendbar auf reine
> Textlisten. Urheberrecht greift hier ja wohl nicht (Stichwort:
> Schöpfungshöhe). Wie ist der Anteil der Rohliste an Trennmustern zu
> bewerten? (Zugegeben: Ohne Rohliste keine Trennmuster.)
Ich glaube, die Schöpfungshöhe ist nicht so niedrig:
1. Die Listen fallen nicht vom Himmel, sondern wurden mit nicht trivial
zu erstellenden Werkzeugen geschaffen (oder in Handarbeit, das glaube
ich aber nicht).
2. Die Listen sind nach Häufigkeit sortiert. Es handelt sich damit
erkennbar nicht um eine Rohliste, sondern um ein aufbereitetes Werk.
3. Die Liste ist vermutlich nicht identisch reproduzierbar, allenfalls
ähnlich.
Inwiefern diese Punkt tatsächlich eine Rolle bei der Bewertung der
Schöpfungshöhe spielen, weiß ich allerdings nicht.
> LPPL wäre vermutlich gut, dann könnten wir die Rohdaten unverändert
> verteilen, hätten aber recht freie Hand unsere geänderten (verbesserten,
> getrennten ...) Versionen frei zu verteilen, so dass auch ein späterer
> Gewinn (wie gering er auch immer bei einer Distribution des
> Gesamtsystems ausfallen mag) die Lizenzen nicht verletzt.
Ich habe mir die LPPL nochmal angesehen und kann darin keine
Beschränkung der Weitergabe ähnlich der GPL erkennen (veröffentlichte,
abgeleitete Werke müssen wieder verfügbar gemacht werden). Wollen wir
auf solche GPL-Klauseln Wert legen oder nicht?
Georg, hast du meine letzte Frage bezüglich des Interesses der
Mannheimer, Leipziger oder Berliner Institutionen gelesen? Falls wir
eine GPL-Klausel wollen, können wir mit denen immer noch eine andere
Lizenz für deren Nutzung unserer Ergebnisse aushandeln, sprich: eine
uneingeschränkte Nutzung der von uns erarbeiteten Listen anbieten
im Gegenzug zu den von ihnen gelieferten Wortlisten.
Wir sollten die folgenden Fragen klären:
1. Wollen wir für unsere Werke eine GPL-ähnliche Beschränkung
oder sollen die Werke ohne weiteres auch zur kommerzieller
Verwendung zur Verfügung stehen (in Rechschreibprüfungen,
Trennhilfen, o.ä.)?
2. Eine GPL-ähnliche Klausel wäre für die angesprochenen
Institutionen möglicherweise ein Entgegenkommen, falls
für die Listen bisher schon ein Geschäftsmodell besteht.
Damit wird einer kommerziellen Verwertung unserer Werke
nämlich zum Teil der Boden entzogen. (Als rein
praktische Auswirkung, verboten wird das keinesfalls.)
Ist die Frage der Verwertungungsrechte für die
Institutionen von Belang?
3. Ist den Institutionen klar, das wir nicht nur neue
Trennmuster erstellen und diese verteilen wollen, sondern
gern auch die Wortlisten? Das heißt, ich denke, wir sind
nicht nur an exklusiven Nutzungsrechten interessiert,
sondern daran, dass die Wortlisten frei verfügbar gemacht
werden (unter welcher Lizenz ist noch unklar).
4. Unter welcher Lizenz stehen Wortlisten anderer Sprachen?
5. Ich habe keine belastbaren Kenntnisse über die rechtliche
Situation. Daher auch an allen Stellen "ich denke" und
"ich glaube". Wo können wir uns rechtlichen Beistand für
die Beantwortung dieser Fragen besorgen? Ginge das über
den Dante e.V. (Stichwort TeX-Consultants). Oder sollten
wir uns mit unseren Fragen in die Öffentlichkeit begeben?
Vielleicht gezielt Leute ansprechen? Wen? Frank Mittelbach?
Viele Grüße
Stephan Hennig
> 3. Ist den Institutionen klar, das wir nicht nur neue
> Trennmuster erstellen und diese verteilen wollen, sondern
> gern auch die Wortlisten? Das heißt, ich denke, wir sind
> nicht nur an exklusiven Nutzungsrechten interessiert,
> sondern daran, dass die Wortlisten frei verfügbar gemacht
> werden (unter welcher Lizenz ist noch unklar).
>
Ja, das habe ich angesprochen, Mannheim lehnt das leider in aller
Deutlichkeit ab. Wir dürfen aber alle abgeleiteten Werke, insbesondere
Trennnmuster, Ausnahmen, aber auch Listen mit ein paar Millionen
getrennten Wörtern veröffentlichen, von denen natürlich die allermeisten
der besagten Mannheimer Liste entspringen.
Jetzt wo wir die Liste des IDS haben (sie schleicht gerade auf meinen
Rechner), kann ich ja auch nochmal in Leipzig fragen, wie es genau mit
den Rechten aussieht, ob man dort vielleicht die Liste an die
OpenSource-Gemeinde spenden möchte. Andernfalls muss der Rest der
Community warten, bis ein Teil der Wörter einmal durch unsere Mühle
gewandert ist.
Gruß, Georg
> Die Liste
>
> · basiert auf dem CCDB2007-Subkorpus (mit 2.249.444.115 Tokens) Des
> Deutschen Referenzkorpus.
>
> · enthält alle im Subkorpus vorkommenden Tokens, d.h. nicht nur
> (lexikalische) Wortformen.
>
> · ist absteigend nach Vorkommenshäufigkeit sortiert.
>
> · enthält zu jedem Token die Angabe der jeweiligen Häufigkeitsklasse.
>
> · wurde bei der Häufigkeitsklasse 25 gekürzt (Klassen 26 und 27
> wurden gelöscht).
>
> · darf in ihrer Gesamtheit – wie vereinbart – nicht veröffentlicht
> oder an Dritte weitergegeben werden.
>
>
> Falls Sie auf die Wortliste referieren wollen, könnten Sie folgende
> Quelle angeben:
> Wortliste des virtuellen Korpus „CCDB2007“ aus Dem Deutschen
> Referenzkorpus (DeReKo),
> http://www.ids-mannheim.de/kl/projekte/korpora/, Institut für
> Deutsche Sprache, Mannheim, 2007.
>
> Ich wünsche Ihnen viel Erfolg bei Ihrem Vorhaben und grüße Sie
> herzlich aus Mannheim
>
> Cyril Belica
Die Häufigkeitsklassen geben an, wievielmal häufiger in der deutschen
Sprache das Wort »der« vorkommt: »Lackschaden« hat Klasse 21, d.h. »der«
kommt etwa 2^21 mal häufiger vor als »Lackschaden«:
http://wortschatz.uni-leipzig.de/html/faq/hkl.html
Wenn ich mal einen beliebigen Auszug ab Zeile 647.149 präsentieren darf:
Lackschaden 21
Lacuna 21
Ladenschlußdebatte 21
Ladeverkehr 21
Lädierten 21
Ladir 21
Lads 21
ladungsfähige 21
Ladungsfrist 21
Lagergeschäft 21
Lagerhaltungskosten 21
Lagersysteme 21
Laghouat 21
Lahnbach 21
Lahntalbahn 21
Laizist 21
Lamentierens 21
Lammbock 21
Lamme 21
Lamperts 21
LAN-Emulation 21
Lanart 21
LANCIA 21
lanciere 21
Landaufenthalt 21
Länderpolizei 21
Länderschlüssel 21
Länderspieljahr 21
Länderspielserie 21
Landesauszeichnung 21
Landesbergamt 21
PS: Und wenn ihr mal richtig den Rechner in die Knie zwingen wollt,
öffnet eine Textdatei mit 4,4 illionen Wörtern, etwa 70MB, im falschen
Programm.
> Soll heißen: Blockiert eine
> unter GPL gestellte Rohliste evtl. später die kommerzielle Weitergabe
> von TeX- bzw. OpenOffice-Distributionen?
Sun ist nicht bereit, Wörterbücher (etc) unter der GPL mit OpenOffice.org
auszuliefern. Das geht nur mit der LGPL, d.h. die Liste muss unter der
LGPL stehen, wenn sie mit OpenOffice mitgeliefert werden soll (und das
soll sie, alles andere wäre ein zu großer Rückschritt aus Benutzersicht).
mfg
Daniel
> Sun ist nicht bereit, Wörterbücher (etc) unter der GPL mit OpenOffice.org
> auszuliefern. Das geht nur mit der LGPL, d.h. die Liste muss unter der
> LGPL stehen, wenn sie mit OpenOffice mitgeliefert werden soll (und das
> soll sie, alles andere wäre ein zu großer Rückschritt aus Benutzersicht).
Ist für OpenOffice die Wortliste selbst auch von Interesse oder sind es
nur die Trennmuster?
In letzterem Fall könnte man die Trennmuster allein als sekundäres Werk
unter die LGPL stellen, das primäre Werk, Wortliste, Trennmuster und
Ausnahmeliste zusammen, unter die GPL. Mir ist der starke
Copy-Left-Gedanke sympatisch. Da die Worliste(n) so umfangreich sind,
sind sie auch ohne Änderungen/Ergänzungen recht brauchbar und damit
möglicherweise auch für kommerzielle Produkte interessant.
Wir sollten uns darauf verständigen, ob wir freie Wortlisten für alle
haben wollen (im Sinne von kostenlos) oder ob wir freie Software
bevorzugen wollen (im Sinne von ohne Nutzungsbeschränkung).
Ein Argument für letzteres wäre wie schon zuvor erwähnt, dass wir mit
der GPL eventuellen Listenspendern entgegenkommen und uns so die
Möglichkeit offenhalten neue Listen einfach in die bestehenden
einzuarbeiten.
Viele Grüße
Stephan Hennig
Das ist eine gute Idee. GPL/LGPL sind vielleicht die falschen
Lizenzen (da primär für Software gedacht und nicht für
Datensammlungen), aber Dein Vorschlag der Zweiteilung ist der richtige
Ansatz, finde ich.
Werner
> Ist für OpenOffice die Wortliste selbst auch von Interesse oder sind es
> nur die Trennmuster?
Es reichen die Trennmuster.
On Wednesday 10 October 2007 15:50, Stephan Hennig wrote:
> Ist für OpenOffice die Wortliste selbst auch von Interesse oder sind es
> nur die Trennmuster?
Es reichen die Trennmuster.
Das stimmt so nicht. Er wollte, daß die originalen US-englischen
Trennmuster, mit denen TeX ausgeliefert wurde und wird, nicht
verändert werden, aus den Gründen, die Du nennst.
> Alle Änderungen/Erweiterungen sollten seiner Meinung nach in eine
> hyphenation-Datei (Ausnahmeregeln) kommen.
Wenn nun diese Ausnahmedatei standardmäßig von TeX geladen wird, hast
Du genau das gleiche Problem, nämlich andere Umbrüche...
Werner
> Knuth selbst hat sich eindeutig gegen neue Trennmmusterdateien
> ausgesprochen ! Dies steht im Zusammenhang mit seinem Anspruch, dass
> Dokumente auch noch nach Jahren dasselbe Ergebnis liefern sollen. Das
> beste Beispiel ist das TeXbook; mit anderen Trennmustern hätte sich was
> geändert und ich könnte nicht exakt dasselbe bekommen
> wie 1984.
Ich fände es sehr sinnvoll, wenn man bei den Trennmustern nicht nur die
Sprache, sondern auch genau die Version angeben könnte, etwa so:
\usepackage[ngerman,date=2007-10-26]{babel}
Darüberhinaus sehe ich auch Bedarf für Varianten der deutschen
Trennmuster, etwa statt mit etymologischer Trennung auch mit "naiver"
Trennung. Die können Probleme vermeiden, wenn man nicht allein arbeitet
und weiß, dass andere (wichtigere) Leute sich nach dem Duden richten.
Leider ist das mit LaTeX nicht so einfach, da die Trennmuster fest ins
Format eingebunden sind. Es müssten daher sämtliche Varianten einer
Sprache vorgehalten werden. Ist das heutzutage ein Problem?
> Alle Änderungen/Erweiterungen sollten seiner Meinung nach
> in eine hyphenation-Datei (Ausnahmeregeln) kommen.
Ich bevorzuge neue Trennmuster.
Viele Grüße
Stephan Hennig
Herbert Voss schrieb:
> Knuth selbst hat sich eindeutig gegen neue Trennmmusterdateien
> ausgesprochen ! Dies steht im Zusammenhang mit seinem Anspruch, dass
> Dokumente auch noch nach Jahren dasselbe Ergebnis liefern sollen. Das
> beste Beispiel ist das TeXbook; mit anderen Trennmustern hätte sich was
> geändert und ich könnte nicht exakt dasselbe bekommen
> wie 1984.
Ich fände es sehr sinnvoll, wenn man bei den Trennmustern nicht nur die
Sprache, sondern auch genau die Version angeben könnte, etwa so:
\usepackage[ngerman,date=2007-10-26]{babel}
>> Ich fände es sehr sinnvoll, wenn man bei den Trennmustern nicht nur die
>> Sprache, sondern auch genau die Version angeben könnte, etwa so:
>>
>> \usepackage[ngerman,date=2007-10-26]{babel}
>
>
>
> wozu denn? _Jeder_ kann sich nach Belieben seine eigene
> Ausnahmedatei erstellen und diese sogar in das Format einbinden,
> wenn er will. Abgesehen davon hat babel ja primär nichts mit der
> Trennliste zu tun.
>
> Wir müssen aufpassen, dass wir nicht in den esoterischen Bereich
> abdriften und die eierlegende Wollmilchsau entwickeln wollen.
Es ist einfach nur eine Idee oder ein Wunsch, wie man umbruchgleiche
Dokumente trotz Entwicklung der Trennmuster sicherstellen könnte. Das
ist nicht als Teil unseres Projekts gedacht, sondern erforderte eine
andere Stelle an der eingegriffen wird, nämlich die Pakete, die die
Trennmuster wählen, zum Beispiel Babel.
Viele Grüße
Stephan Hennig
Georg, Deiner anderen E-Mail kann ich die Erlaubnis der Weitergabe
abgeleiteter Wortlisten nicht entnehmen. Dort steht lediglich, dass die
Liste in ihrer Gesamtheit nicht ver�ffentlicht werden darf.
> � darf in ihrer Gesamtheit � wie vereinbart � nicht ver�ffentlicht
> oder an Dritte weitergegeben werden.
Ich bin mit nicht sicher, ob der Umkehrschluss gezogen werden kann.
Hast Du eine E-Mail, der das "- wie vereinbart -" genauer entnommen
werden kann? Kannst Du den relevanten Schriftwechsel allen, die das
betrifft, nochmal zug�nglich machen (am besten die vollst�ndigen E-Mails
mit Kopf)?
Viele Gr��e
Stephan Hennig