Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

1. RfD BI-Limits für Gruppen der Hierarchie de.* (Richtlinienverfahren)

0 views
Skip to first unread message

Peter Heirich

unread,
Jun 23, 2023, 2:49:11 PM6/23/23
to
1. RfD BI-Limits für Gruppen der Hierarchie de.* (Richtlinienverfahren)


Die aktuell gültige Fremcancelrichtlinie soll ergänzt werden.

Aktuelle Richtlinie: https://www.dana.de/bi-limits.html

Bisher gelten als im wesentlichen inhaltsgleich insbesondere:

Postings mit identischem Body
beinahe identische Postings, die nur minimal auf die jeweilige
Newsgruppe angepasst sind
Postings, die dieselbe Sache (Produkt, Website etc.) bewerben
Postings, die ausschliesslich aus einer identischen Signatur bestehen
Postings die Zitate anderer User beinhalten, ansonsten aber identisch sind

Zukünftig sollen zusätzlich auch als inhaltsgleich gelten:

Postings, die von einer KI Software erstellt wurden

Grund:

Anfrage an ChatGPT:

Erstelle mir bitte 10 Werbepostings für Berlin, deren Breidbart-Index
maximal 3 ist.

Antwort:
<ChatGPT
url="https://chat.openai.com/share/22291ccd-ee8a-41e6-8040-6deaa22705c1">
Natürlich! Hier sind 10 Werbepostings für Berlin mit einem maximalen
Breidbart-Index von 3:

"Entdecke die Schönheit Berlins! Genieße die historische Architektur,
besuche weltberühmte Museen und erlebe das pulsierende Nachtleben.
#Berlin #Kultur #Spaß"

"Berlin ruft! Verpasse nicht die Gelegenheit, die einzigartige
Street-Food-Szene der Stadt zu erleben. Von Currywurst bis zu
internationalen Köstlichkeiten - hier findest du alles! #Foodie #Berlin
#StreetFood"

"Dein Shopping-Paradies erwartet dich in Berlin! Von hippen Boutiquen bis
zu bekannten Marken - hier findest du alles, was das Herz begehrt. Komm
vorbei und erlebe den Einkaufstraum! #Shopping #Berlin #Style"

"Berlin - die grüne Oase inmitten der Stadt! Entspanne dich in den
zahlreichen Parks und Gärten, genieße einen Spaziergang entlang der
Uferpromenade oder miete dir ein Fahrrad und erkunde die Stadt auf eigene
Faust. #Natur #Berlin #Entspannung"

"Kunst und Kultur in Berlin! Besuche die berühmte Museumsinsel, bewundere
zeitgenössische Kunst in Galerien und lass dich von der kreativen
Atmosphäre der Stadt inspirieren. #Kunst #Kultur #Berlin"

"Berlin bei Nacht - erlebe das Nachtleben der Superlative! Von trendigen
Bars und Clubs bis hin zu Live-Musik und DJ-Sets - hier findet jeder seine
perfekte Party. #Nachtleben #Feiern #Berlin"

"Berlin, die Stadt der Geschichte! Tauche ein in die bewegende
Vergangenheit Berlins, besuche das Brandenburger Tor, die Berliner Mauer
und das Holocaust-Mahnmal und lerne aus der Geschichte. #Geschichte
#Berlin #Kultur"

"Berlin, die Sportstadt! Egal ob Fußball, Basketball oder Leichtathletik
- hier findest du hochkarätige Sportveranstaltungen und kannst selbst
aktiv werden. Bleib fit und erlebe den Sportsgeist Berlins! #Sport #Berlin
#Fit"

"Berlin, die Techno-Hauptstadt! Tanze bis zum Morgengrauen zu den besten
elektronischen Beats. Die angesagtesten Clubs und Festivals warten darauf,
von dir entdeckt zu werden. #Techno #Party #Berlin"

"Entdecke das multikulturelle Berlin! Genieße die Vielfalt der
internationalen Küche, tauche ein in verschiedene Kulturen und lerne neue
Menschen kennen. Berlin ist bunt und weltoffen! #Multikulti #Berlin
#Vielfalt"

Ich hoffe, diese Werbepostings gefallen dir und erfüllen den gewünschten
Breidbart-Index!
</ChatGPT>

Es wird tatsächlich schwierig sein, bei "normalen" Themen solche KI
Postings zu erkennen

Der Gesetzgeber hat inzwischen anklingen lassen, dass sämtliche KI
Software verpflichtend, entsprechende Kennzeichnungen z.B. per sog.
Wasserzeichen vorzunehmen hat.

Da Text und Wasserzeichen schwierig zusammenzubringen sind, habe ich
OpenAI gebeten, ein entsprechendes Projekt aufzusetzen und z.B.
Digestwerte der generierten Texte (z.B. md5,sha256) gesamt und von
Teiltexten (z.B. Absätzen, Tabellen u.ä.) verfügbar zu machen.

Sinn wäre, selbst mit Teiltexten, z.B. einem Absatz, den KI-Ursprung
nachweisen zu können. Das würde zur Verschleierung eine in der Regel
teure manuelle Nachbearbeitung erfordern und wäre dann wieder manuellen,
menschlichen Postings gleichzustellen.

Zumindest wird aber eine Klärung benötigt, wie, selbst stärker durch KI
geänderte, Postings bei massenweisem Auftauchen zu behandeln sind.

Wir haben m.E, schon ausreichend User, die von dpa-Meldungen bis zu
Pressemitteilungen des Kreml als "Human Gateway" posten.

Nichts gegen den Turing-Test, aber Haupt- und Dauerinhalt des usenets
sollte er nicht werden.

Gruß
Peter

--
Fertige Artikel für de.admin.news.announce, Einsprüche und sonstige
Mail an die Moderation bitte an <mode...@dana.de>. Bitte keine
Diskussionsbeiträge an diese Adresse. Weitere Informationen zum
Verfahren in <news:de.admin.infos> und unter <http://www.dana.de/>.

Marco Moock

unread,
Jun 23, 2023, 3:16:25 PM6/23/23
to
Am 23.06.2023 um 20:49:08 Uhr schrieb Peter Heirich:

> Der Gesetzgeber hat inzwischen anklingen lassen, dass sämtliche KI
> Software verpflichtend, entsprechende Kennzeichnungen z.B. per sog.
> Wasserzeichen vorzunehmen hat.

Wer soll das kontrollieren und umsetzen?
Wer haftet da?
Die KI?
Der Poster?
Der Serverbetreiber?
Wie wird das nachgewiesen?

> Wir haben m.E, schon ausreichend User, die von dpa-Meldungen bis zu
> Pressemitteilungen des Kreml als "Human Gateway" posten.

dpa-Meldungen solltem mit dem Ende von Mixmin weitestgehend erledigt
sein.

> Nichts gegen den Turing-Test, aber Haupt- und Dauerinhalt des usenets
> sollte er nicht werden.

Das können die Server-Betreiber über abuse-Meldungen doch eigentlich
relativ gut selbst regeln und ggf. blockieren.

Peter J. Holzer

unread,
Jun 24, 2023, 2:02:56 AM6/24/23
to
On 2023-06-24 04:05, Peter Heirich <talk....@info21.heirich.name> wrote:
> HIER geht es nur um die Frage, ob bei der Ermittlung des Breidbart-Index
> nachweislich von einer KI erzeugte Texte (vollständig oder zumindest in
> Teiltexten) als inhaltsgleich gezählt werden, selbst wenn sie, dank der
> besonderen KI-Fähigkeiten, deutlich abweichende Formulierungen aufweisen.

Meiner Meinung nach: Nein. "Inhaltsgleich" muss sich auf den Inhalt
beziehen, nicht auf den Absender. Wenn es die gleiche Information ist,
die nur verschieden formuliert wurde, kann man das als inhaltsgleich
ansehen, aber Postings mit unterschiedlicher Information sind sicher
nicht inhaltsgleich, nur deshalb, weil sie von der gleichen KI verfasst
wurden (oder gar von irgendeiner KI verfasst wurden).

Sollte das Usenet von KI-generierten Messages geflutet werden
(unwahrscheinlich, dafür ist das Usenet zu wenig hip[1]), wird man
(individuall oder kollektiv) sich etwas überlegen müssen, aber der BI
ist fast sicher das falsche Werkzeug.

hp

[1] So wie dieses Wort

Marco Moock

unread,
Jun 24, 2023, 2:46:59 AM6/24/23
to
Am 24.06.2023 um 04:05:25 Uhr schrieb Peter Heirich:

> Wegen der Problematik der Abschluß-, Diplom- und Doktorarbeiten wird
> der Gesetzgeber, einfach weil Bedarf besteht, eine Prüfmöglichkeit
> von allen Anbietern von KI-Software erzwingen.

Sowas hat ja mit Warez-Portalen und Schmuddelseiten mit Alterskontrolle
auch immer gut funktioniert.
Wer diese Prüfsumme entfernen will, kann ja die Ausgabe der KI einfach
anpassen und erst dann verbreiten.

Plagiate bei Doktorarbeiten gab es schon immer - wird es auch immer
geben.

Lars Gebauer

unread,
Jun 24, 2023, 4:20:22 AM6/24/23
to
Am 24.06.2023 um 06:05 schrieb Peter Heirich:
> Wegen der Problematik der Abschluß-, Diplom- und Doktorarbeiten wird der
> Gesetzgeber, einfach weil Bedarf besteht, eine Prüfmöglichkeit von allen
> Anbietern von KI-Software erzwingen.

Mit den mittlerweile verfügbaren open source KI-Modellen wird das zu
einem sehr lustigen Unterfangen.

> Derzeit werden teilweise Tools angeboten, die eine
> Wahrscheinlichkeitsbewertung vornehmen, die aber auch Mängel haben.

"Mängel" ist sehr freundlich ausgedrückt. Tatsächlich ist ein Münzwurf
um Größenordnungen zuverlässiger. Und nein: Es gibt keine Möglichkeit,
diese Mängel zu beseitigen.
--
Diese Kommunismus-Phobie in der heutigen Zeit ist besorgniserregend.
https://twitter.com/Berivan_Aslan_/status/1666381656129667073

Marcel Logen

unread,
Jun 24, 2023, 6:39:03 AM6/24/23
to
Marco Moock in de.admin.news.misc:

>Am 23.06.2023 um 20:49:08 Uhr schrieb Peter Heirich:

[...]

>> Wir haben m.E, schon ausreichend User, die von dpa-Meldungen bis zu
>> Pressemitteilungen des Kreml als "Human Gateway" posten.
>
>dpa-Meldungen solltem mit dem Ende von Mixmin weitestgehend erledigt
>sein.

Ist das jetzt nicht faktisch eine UDP gegen mixmin?

Hätte das/die nicht in danan diskutiert und in danaa veröffent-
licht werden müssen (oder umgekehrt)?

Marcel 1lpme (1763022)

fup2 danan
--
╭─╮ ╭────────╮ ╭───────╮ ╭─────╮ ╭──╮ ╭───╮
│ ╰────╯ ╭─────╯ ╰──╮ ╭─╯ ╰──╮ │ │ │ │ ╰─╮
╯ ╭──────╯ ╭──────╮ ╭───╯ ╰──╮ ╭─╮ ╭──╯ ╰─╮ │ ╰──╯ ╰
╰─────────╯ ╰──────╯ ╰─╯ ╰───────╯ ╰─╯ e360cf

Marcel Logen

unread,
Jun 24, 2023, 6:43:15 AM6/24/23
to
Peter Heirich in de.admin.news.misc:

>Peter J. Holzer wrote:

>>Meiner Meinung nach: Nein. "Inhaltsgleich" muss sich auf den Inhalt
>>beziehen, nicht auf den Absender. Wenn es die gleiche Information ist,
>>die nur verschieden formuliert wurde, kann man das als inhaltsgleich
>>ansehen, aber Postings mit unterschiedlicher Information sind sicher
>>nicht inhaltsgleich, nur deshalb, weil sie von der gleichen KI verfasst
>>wurden (oder gar von irgendeiner KI verfasst wurden).

Ich schließe mich dieser Ansicht an.

>Du würdest
>
>"Berlin ruft! Verpasse nicht die Gelegenheit, die einzigartige
>Street-Food-Szene der Stadt zu erleben. Von Currywurst bis zu
>internationalen Köstlichkeiten - hier findest du alles! #Foodie #Berlin
>#StreetFood"
>
>und
>
>"Berlin, die Sportstadt! Egal ob Fußball, Basketball oder Leichtathletik
>- hier findest du hochkarätige Sportveranstaltungen und kannst selbst
>aktiv werden. Bleib fit und erlebe den Sportsgeist Berlins! #Sport
>#Berlin #Fit"
>
>als inhaltsgleich erkennen ?

Sie sind aber doch gar nicht inhaltsgleich.

>Beides je eine von KI generierte Werbung für Berlin.

Das schon.

Marcel 1lpon (1763095)
--
───╮ ╭─╮ ╭─╮ ╭─────╮ ╭──────╮ ╭───╮ ╭───╮ ╭─╮ ╭─────╮
╰──╯ ╰───╯ ╰─╯ ╭──╯ ╰────╮ │ ╰─╮ ╰────╯ ╰───╯ ╰─╯ ╭──╯
╭───╯ ╭─╮ ╭──╯ ╰─╮ ╰────╮ ╭────╯ ╭──╮ ╭─╮
╰─────╯ ╰───╯ ╰───────╯ 23153b ╰──────╯ ╰─╯ ╰───

Peter J. Holzer

unread,
Jun 24, 2023, 7:08:00 AM6/24/23
to
On 2023-06-24 08:16, Peter Heirich <talk....@info21.heirich.name> wrote:
> Peter J. Holzer wrote:
>>Meiner Meinung nach: Nein. "Inhaltsgleich" muss sich auf den Inhalt
>>beziehen, nicht auf den Absender. Wenn es die gleiche Information ist,
>>die nur verschieden formuliert wurde, kann man das als inhaltsgleich
>>ansehen, aber Postings mit unterschiedlicher Information sind sicher
>>nicht inhaltsgleich, nur deshalb, weil sie von der gleichen KI verfasst
>>wurden (oder gar von irgendeiner KI verfasst wurden).
>
> Du würdest
>
> "Berlin ruft! Verpasse nicht die Gelegenheit, die einzigartige
> Street-Food-Szene der Stadt zu erleben. Von Currywurst bis zu
> internationalen Köstlichkeiten - hier findest du alles! #Foodie #Berlin
> #StreetFood"
>
> und
>
> "Berlin, die Sportstadt! Egal ob Fußball, Basketball oder Leichtathletik -
> hier findest du hochkarätige Sportveranstaltungen und kannst selbst aktiv
> werden. Bleib fit und erlebe den Sportsgeist Berlins! #Sport #Berlin #Fit"
>
> als inhaltsgleich erkennen ?
>
> Beides je eine von KI generierte Werbung für Berlin.
>
> In verschiedenen Gruppen: de.rec.mampf und de.rec.sport.fussball (wegen
> Union) merkt das nicht einmal wer, dass es Werbung für Berlin ist.
>
> Inhaltsgleich.

Da der erste Text klar in de.rec.sport.fussball off-topic ist und der
zweite in de.rec.mampf, sind sie offensichtlich nicht inhaltsgleich.

(Werbung dürfte in beiden Newsgroups nicht gerne gesehen sein, aber das
nur nebenbei.)

>>Sollte das Usenet von KI-generierten Messages geflutet werden
>
> Heute ist WWW bereits eine Qual, weil 18 Hersteller und 37 Versandhäuser
> glauben, wegen dem einen Bügeleisen das ich online gekauft habe, bräuchte
> ich jetzt weitere 55 Bügeleisen in verschiedenen Farben und Ausführungen.
>
> Auf jeder Seite muß ich immer wegklicken, doch heute keine Bügeleisen zu
> benötigen.

Irgendwas mache ich falsch. Ich bekomme keine Werbung für Bügeleisen ...

Aber das ist irrelevant. Falls Du es die letzten 20 Jahre nicht
mitbekommen haben solltest: Das (de-)Usenet interessiert nur noch ein
paar Nerds. Niemand wird das mit KI-generierter Werbung fluten, weil es
da nichts zu verdienen gibt. Im schlimmsten Fall eskaliert die Kirche
des Heiligen Detlef ihr Flame-Ritual, aber das wars.

hp

Peter J. Holzer

unread,
Jun 24, 2023, 8:25:09 AM6/24/23
to
On 2023-06-24 11:57, Peter Heirich <talk....@info21.heirich.name> wrote:
> Peter J. Holzer wrote:
>>Da der erste Text klar in de.rec.sport.fussball off-topic ist und der
>>zweite in de.rec.mampf, sind sie offensichtlich nicht inhaltsgleich.
>
> Du willst off-topic grundsätzlich canceln?

Nein, ich verwende die Frage, ob ein Text off-topic ist als Litmus-Test
für die Frage der Inhaltsgleichheit. Wären die beiden Texte
inhaltsgleich, müssten die Frage "ist das in Gruppe X off-topic" für
beide Texte das gleiche Ergebnis liefern. Das ist aber (für mich, und
IMNSHO offensichtlich) nicht der Fall. Also sind die beiden Texte nicht
inhaltsgleich.

hp

Peter J. Holzer

unread,
Jun 25, 2023, 7:23:38 AM6/25/23
to
On 2023-06-25 10:12, Peter Heirich <talk....@info21.heirich.name> wrote:
> Ich:
> Sind die beiden letzten Postings im Wesentlichen identisch?

ChatGPT solche Fragen zu stellen, mag zwar erheiternd sein, führt aber
nicht zu belastungsfähigen Aussagen.

Zwei Beispiele, die es in die Medien geschafft haben:

Ein Lehrer hat Arbeiten seiner Schüler ChatGPT vorgelegt, mit der Frage,
ob ChatGPT die geschrieben habe. ChatGPT hat das in allen Fällen bejaht,
worauf der Lehrer die mit Nicht Genügend beurteilt hat.

Ein Anwalt hat sich von ChatGPT passende Gerichtsurteile ausgeben
lassen. Auf die Frage, ob die Urteile echt seien, hat ChatGPT mit Ja
geantwortet. Der Anwalt hat die dann ohne weitere Recherche in seine
Argumentation eingebaut.

In beiden Fällen war die Auskunft von ChatGPT falsch. Weder hat es die
Arbeiten der Schüler geschrieben noch waren die Urteile echt.

(Der Lehrer kommt vermutlich mit der Korrektur der Noten und einer
Entschuldigung davon. Den Anwalt könnte das die Zulassung kosten.)

hp

Peter J. Holzer

unread,
Jun 25, 2023, 2:40:00 PM6/25/23
to
On 2023-06-25 12:29, Peter Heirich <talk....@info21.heirich.name> wrote:
> Peter J. Holzer wrote:
>>>Ich:
>>> Sind die beiden letzten Postings im Wesentlichen identisch?
>>
>>ChatGPT solche Fragen zu stellen, mag zwar erheiternd sein, führt aber
>>nicht zu belastungsfähigen Aussagen.
>
> Damit hast du ein ähnliches Problem, nur von der anderen Seite:
>
> Von der KI festgestellte Aussagen ignorieren wir, weil diese von einer
> KI-Software stammen.

Nein, nicht weil sie von einer KI-Software stammen, sondern weil sie von
einem generativen Transformer stammen.

ChatGPT ist ein Laberautomatat. Der generiert einfach nur zu jedem Text
die wahrscheinlichste Fortsetzung. Das ist erwartungsgemäß sehr gut
darin, Texte zu produzieren, die so klingen, als ob sie von einem
Menschen stammen. Es ist etwas überraschenderweise auch relativ gut
darin, Fragen zu beantworten, auf die es eine allgemein bekannte
korrekte Antwort gibt (vermutlich, weil die eine richtige Antwort im
Trainingskorpus öfter vorgekommen ist als jede der vielen falschen
Antworten). Aber sobald es etwas obskurer wird oder persönliche
Einschätzung gefragt ist, produziert es mehr oder weniger zufälligen
Output. Bzw. nicht ganz zufällig: ChatGPT wurde darauf trainiert, "nett"
zu sein (ich würde das schon "unterwürfig" nennen). Das führt offenbar
dazu, dass es dem Fragesteller im Zweifelsfall recht gibt, oder auf
Fragen zustimmend antwortet.

Es gibt andere Arten von KIs, und es ist sicherlich möglich, eine KI zu
trainieren, die die Frage "sind zwei Texte inhaltsgleich" mit hoher
Wahrscheinlichkeit richtig (d.h. so wie die meisten Menschen)
beantwortet. Aber diese KI ist nicht ChatGPT.

hp

0 new messages