Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.

Dismiss

Hallo, Heute: Deutsch, die 2te :-)

10 views

Skip to first unread message

jensk...@gmail.com

unread,

Mar 2, 2019, 5:13:17 PM3/2/19

Hallo Leute,

wieder was von meiner Bastelecke:

https://github.com/paule32/deutsch

hierbei handelt es sich um einen (noch nicht vollstandigen)
Deutsch checker.
Einfacher Parser im strict Mode.
Desweiteren wird noch zwischen Groß- und Kleinschreibung
geprüft.

$ clisp -i duden.lisp

==> "der"

Gruß, Jens

Jens Kallup

unread,

Mar 3, 2019, 3:41:56 AM3/3/19

Jens Kallup

unread,

Mar 3, 2019, 3:41:57 AM3/3/19

Joachim Pimiskern

unread,

Mar 3, 2019, 9:10:20 AM3/3/19

Hi,

ich finde es mutig, sich an Deutsch heranzutrauen.
Für KI-Zwecke scheint mir Englisch besser geeignet
zu sein, weil es da weniger Flexionen gibt.

https://www.cs.utah.edu/~gback/awfgrmlg.html

Grüße,
Joachim

Jens Kallup

unread,

Mar 3, 2019, 10:31:47 AM3/3/19

Am 03.03.19 um 15:10 schrieb Joachim Pimiskern:

ja normal kann ja eine Maschine nur nach Regeln Texte
parsen. SOP.
Aber gerade das "the" hat ja mehrere Bedeutungen, und
im Deutschen wird diese Bedeutung aufgegliedert.
In dem Zusammenhang entstehen Sätze natürlich auch in
Form: Erdmännchen - ist das nun female oder male, oder
gar beides?

Ich empfinde es angenehm, Sätze nach Satzbau zu parsen
anstatt Große Datenbanken zu haben, in denen versucht
wird, zu jeden Sachverhalt eine Lösung zu finden, indem
man Sätze oder Aussagen durch iteriert.

Beispiel:
"die Sonne"
"die Sonne scheint hell"
...

Als Übungsaufgabe mittels geeigneter Programmiersprache
einen statischen Datenbestand zu genieren mag das wohl
noch gehen, bei der man Dictionaries anlegt.

Aber rein von der Logik her is das sinnfrei.
Was Sinn macht, sind Nachschlagewerke, die zum Beispiel
die Wörter: "S" -> Sauna, Sonne,
oder: "B" -> Bau, Baustelle
enthalten.

Das mag jetzt viel Arbeit bedeuten. Ok, aber ein Satzsystem
ist dann schneller.
Klar, einer muss erstmal dieses System aufbauen.
Wobei noch nicht gesagt werden kann, das dieses System gut
oder ausreichend ist.

In meinen Draft, das Ihr erkennen könnt - habe ich Lisp
verwendet, weil dies sehr gut Listen verwalten kann und
während der Laufzeit erweiterbar ist.

Als Startpunkt habe ich "der" (männlichen) Verben-Substantive
gewählt.
Zum Beispiel kann dann, falls keine dazugehörigen Daten
gefunden werden konnten, nach "die" (weiblich) - die Sonne -
gesucht werden.

Und so arbeitet man sich vorwärts.
Im Archive habe ich Adjektive von A - Z zusammen getragen,
die das Lisp System sehr schnell bearbeiten kann.

Man muss dann nicht mehr "die Sonne", "die Katze" einzeln
suchen, sondern man gibt einen Satz Wörter auf Benutzerebene
ein, und vergleicht die Wörter mit den Regeln und die Referenz
zur Liste.

Gruß, Jens

0 new messages