Das Thema Webkataloge wird in diesem Forum ja immer wieder ausführlich
diskutiert. Meine Kolleginnen Daniela und Claudia haben jetzt dazu
einen Post auf unserem Webmaster-Zentrale Blog geschrieben, der einige
von euch vielleicht interessieren könnte.
http://googlewebmastercentral-de.blogspot.com/2008/06/webkataloge-im-... Und natürlich interessiert uns eure Meinung und Feedback!
ich betrachte euren o.g. Artikel leider mit sehr kritischen Augen.
Eines der Dinge, die mich schon immer bei Google gestört haben, ist
die so genannte Prüfung von "hochqualitativen" Content. Hier schreibt
ihr:
[...] In Google arbeiten wir ständig daran, unseren Usern Content von
hoher Qualität anzubieten. [...]
Diese sogenannte Arbeit kann sich aber nicht auf rechtmäßige Webseiten
beziehen! Diese Arbeit kann sich NUR auf RECHTSWIDRIGE Webseiten
beziehen!
In dem Moment, bei der Google eine rechtmäßige Webseite anhand seines
Inhalts bewertet, betreibt Google eine Zensur und könnte somit sogar
gegen unsere Verfassung, Artikel 5 GG, verstoßen (Meinungs- und
Pressefreiheit; Freiheit der Kunst und der Wissenschaft).
Google erwähnt immer wieder, dass die Bewertung von Webseiten
hauptsächlich anhand der durch die Webseiten untereinander bestehenden
Links berechnet wird (PageRank) und nicht anhand seiner Inhalte.
Anhand aber der Feststellung, dass es ein "Search Quality Team" bei
Google gibt und diese Webkataloge anhand ihres Inhalts bewertet werden
sollen und sogar Google noch vorschlägt welche Inhalte von Google in
Webkatalogen erwartet werden, ist dies definitiv eine negative
Beeinflussung der einzelnen Webseitenbetreiber und könnte den
Tatbestand des § 240 StGB (Nötigung) erfüllen.
"Wer einen Menschen rechtswidrig [...] durch Drohung mit einem
empfindlichen Übel zu einer Handlung, Duldung oder Unterlassung
nötigt, wird mit Freiheitsstrafe bis zu drei Jahren oder mit
Geldstrafe bestraft."
Rechtswidrig wäre der Versuch einen Webseiteninhaber in seinen Rechten
aus Artikel 5 GG negativ zu beeinflussen, wenn er diesen
Rechtsanspruch verwirklichen will aber dabei nicht den Vorstellungen
von Google entspricht und dadurch das Übel hinnnehmen müsste durch ein
"Search Quality Team" negativ bewertet zu werden. Um dieses "Übel",
eben nicht in Google gut oder überhaupt nicht gelistet zu werden zu
vermeiden, nimmt der Webseitenbetreiber diese Nötigung hin und richtet
sich nach der Vorgabe der Vorstellungen eines "Search Quality Teams"
bzw. den Google-Vorgaben.
Mit dieser Festellungen möchte ich aufzeigen, wie schwierig und
gefährlich es ist, als Suchdienstanbieter Webseiten anhand der
rechtmäßigen Inhalte zu werten.
zunächst ist mir nicht völlig klar, welche Art von Webkatalogen
betroffen und gemeint ist. Werden hier ausschließlich Verzeichnisse
beschrieben, die andere Webseiten strukturiert beinhalten (Top-
Beispiel DMOZ)? Ich vermute einfach, dass genau diese gemeint sind!
OK, der Ansatz diese qualitativ zu bewerten und somit die darin
enthaltenen Backlinks auf andere Seiten zu gewichten ist ja im
Interesse von Google. Wegen der Trägheit (vorsichtig formuliert) der
DMOZ kann man sich ja nicht nur auf diese verlassen.
Ist das auch rechtlich kritisch wie Rob es beschreibt? Ich meine
nicht, denn es wird nach meinem Verständnis ja nur gesagt, dass die
Seiten aufgrund der Inhalte nicht nur durch Algorithmen, sondern auch
durch manuelle Prüfungen bewertet werden. Eigentlich nicht viel
anderes passiert ja in Bewertungsforen, in denen Nutzer Angebote und
Produkte bewerten. Die Tatsache, dass diese Seiten aufgrund der von
Menschen durchgeführten Bewertungen dann besser oder schlechter
platziert werden erscheint logisch und sinnvoll.
Nötigung kann ich aus dem Beitrag eigentlich nicht herauslesen. Denn
es wird ja nicht gesagt, dass die Kataloge einen bestimmten Aufbau
haben müssen, sondern dass deren Inhalte möglichst umfangreich sein
sollen und sauber recherchiert sein müssen, um gut gewichtet zu
werden.
Anders formuliert:
Google sucht nach Katalogen, die sie für ihre Zwecke (Beurteilung der
verlinkten Seiten) nutzen können. Die anderen machen sich die Arbeit,
Google profitiert davon. Denn seien wir mal ehrlich, wer außer
Webmastern sucht denn in Webverzeichnissen nach Inhalten?
Es liegt wohl im Sinn der Sache, dass ein suchender User relevante
Ergebnisse bevorzugt, die ihm schnell und einfach nützen, sein Problem
lösen oder seinen Wunsch erfüllen helfen. Und da nun mal nicht alle
Ergebnisse auf die erste Position der ersten Ergebnisseite passen,
muss ein Verfahren/ Algorithmus über die Reihenfolge entscheiden.
Allein die Masse der Spamseiten würde ohne diesen jede Suchmaschine
völlig unbrauchbar machen.
Die Reihenfolge im Ranking eines Dokuments (Relevanz, Wichtigkeit,
Aussagekräftigkeit, Nutzen für den User usw.) hängt nun aber wohl eher
vom Dokument selbst, nie aber von Google oder gar irgendeinem Katalog
ab.
Letztere sind völlig entbehrlich, außer, jemand sucht ganz speziell
nach "Katalogen, Verzeichnissen, Indexen, Hilfs-Suchmaschinen,
Hilfslisten etc." in der Keyword-Kombination. Wer wünscht sich Umwege,
Weiterleitungen, Nirwana usw.? Es stimmt - selbst das "Musterbeispiel"
DMOZ hat sich längst als gegen den User gerichtet erwiesen.
Ein völlig anderes Problem sind die im Algorithmus enthaltenen
Verwerfungen (maschinell oder manuell) , die es immer wieder erlauben,
den User massiv zu täuschen und als Verbraucher zu entmündigen, zum
Teil sogar erkennbar gewollt, durch Google selbst initiiert. Und hier
leisten die "Kataloge" fast immer ihren Anteil ... Das ist wohl eher
das Problem.
Jau, das sind alles Selbstverständlichkeiten, die oft nicht
selbstverständlich sind.
Ich kenne da ein Verzeichnis, das noch ein paar Kategorien mehr
enthalten könnte ^^
sehe ich wir Ihr, nur bei einer Berwertung, wie diese zum Beispiel auf
anderen Webseiten mit "mehreren Themen" stattfindet, entscheidet die
Mehrheit. Also hier herrscht das Demokratieprinzip. Gute Beiträge
erhalten durch User eine positive oder negative Bewertung.
Der Betreiber solcher vielfältigen thematisch bezogenen Webseiten
versucht sich also gegenüber seinen Besuchern zu "neutralisieren". Aus
diesem Grund sich solche Webseiten auch im Internet meist sehr
beliebt, weil diese auch langfristig den Geschmack der Mehrheit der
User im Netz treffen.
Man denke an DIGG, kostenlos.de, WebNews, usw..
Auch Wiki-Search versuchte diesen Ansatz der "bewerteten Suche".
Leider hat es Wikipedia so schlecht verstanden einen Suchdienst zu
verwirklichen. Aus dem Grund wird solch eine "bewertete Suche durch
User" wohl erst einmal noch etwas dauern.
Wie gesagt, es geht nicht um eine Bewertung von Inhalten selbst,
sondern lediglich von wem und wie und wann der Beigeschmack einer
"Zensur" entsteht. Und wenn ein Anbieter gleich auch alleinger
Bewerter ist, ist dies unter Umständen sehr problematisch. Man stelle
sich einfach nur vor: Da sitzt der Angstellte Müller im "Search Google
Team" und findet den Webkatalog X im Internet seiner Meinung nach:
"Boooaahhhrr, ist das Teil schlecht, will keine Sau sehen - da muss
ich manuell mal eingreifen um die Pos zu korrigieren".
der von uli hier empfohlene blogbeitrag ist in eher ungewöhnlich
zurückhaltendem tonfall geschrieben, wie ich finde ... diesmal gar
nicht ganz schlecht und ohne den üblichen hype, wie weltbeglückend
revolutionär die enthaltene frohe botschaft wieder einmal wirken
wird ...
als antwort auf den trotzdem durchscheinenden (mir unbegreiflichen)
kommandogeist ("so und nicht anders", nötigung ist das nicht, das es
im effekt erst in verbindung mit der monopolstellung natürlich doch
wieder zur nötigung wird - zumal wir hier über webkataloge, also
rechtlich gesehen über "konkurrenten" des monopolisten reden, ist so
vermutlich im gesetz nicht vorgesehen), wie gesagt, als antwort hat
uzimmi bereits bedenkenswertes geschrieben:
>>> Google sucht nach Katalogen, die sie für ihre Zwecke
>>> (Beurteilung der verlinkten Seiten) nutzen können. Die
>>> anderen machen sich die Arbeit, Google profitiert davon
genau. ich weise darauf hin, dass google ja wohl darauf angewiesen
ist, aktuell zu bleiben, d.h. auch neue seiten zu entdecken, und das
tun sie ja nicht so, wie sie's vielleicht gerne darstellten, kraft
magisch überirdischer kristallkugeln im besitz des larry page, sondern
indem sie ganz profan seiten abklappern, auf denen neue links zu
erwarten sind, an denen sie sich bedienen können. das können blogs
sein aber eben auch webkataloge. seine nie beschriebene abkunft vom
DMOZ-datenbestand ist dem google-index stellenweise bis auf den
heutigen tag noch anzumerken und google sind die letzten, die mit dem
katalog-bashing hätten anfangen sollen ... do no evil ... *fingerdroh*
ich hab' mich übrigens immer gefragt und tu's noch, warum sie nicht
selber einen katalog erstellen, mit ihren 10.000 "human evaluators"
sollte es doch möglich sein, dem automatisierten index qualitativ
gewaltig auf die sprünge zu helfen oder ihn gar zu ersetzen ...
> ich hab' mich übrigens immer gefragt und tu's noch, warum sie nicht
> selber einen katalog erstellen, mit ihren 10.000 "human evaluators"
> sollte es doch möglich sein, dem automatisierten index qualitativ
> gewaltig auf die sprünge zu helfen oder ihn gar zu ersetzen ...
Ich glaube die Antwort auf diese Frage zu kennen:
Diese 10.000 "human evaluators" wird die Gesamtanzahl weltweit sein?!
Wie viele davon sprechen die passende Landessprache (z.B. Deutsch), um
Seiteninhalte bewerten zu können? Setzt man diese Anzahl in das
Verhältnis zur Anzahl der zu überprüfenden und sich täglich ändernden
Seiten, dann wären selbst 10.000 deutschsprachige Bewerter damit
überfordert. Hinzu kommt noch der Aspekt, dass diese Leute wirklich
objektiv den Wert von Seiten beurteilen müssten, aber welcher Mensch
ist grundsätzlich immer objektiv? Davon abgesehen, dass diese Bewerter
und dessen Familien rund um die Uhr Personenschutz benötigen würden -
da sind gewaltige wirtschaftliche Interessen im Spiel, und da zögern
einige "Genossen" auch nicht mit etwas rabiateren Methoden das Ranking
zu beeinflussen ("Du willst doch nicht, dass Deiner Frau oder Deinen
Kindern etwas passiert...").
Maschinen bzw. Programme sind da weniger gefährdet. Immer gleich gut
bzw. (eher) schlecht und vieeel schneller als jeder Mensch. Keine Frau
und keine Kinder und wenn man sie meuchelt dann läuft das gesicherte
Programm eben auf einem anderen Rechner / in einem anderen
Rechenzentrum.
OK, klingt wie eine Räuberpistole, aber die Welt ist nun einmal
wirklich schlecht!
WikiSearch wäre da geeigneter, wäre der bisherige Ansatz nicht so
grottenschlecht. Das würde nur funktionieren, wenn viele Seiten von
vielen Menschen bewertet würden und das ganze auch noch sicher vor
Manipulationen geschützt wäre.
na das sehe ich (sorry - lol) wieder einmal anders :-)
Luzie's Ansatz ist richtig gut. Es wäre nicht einmal nötig, dass
10.000 User bei diesen "Bewertungen" teilnehmen. Akzeptiert ist die
Meinung, dass 1000 Befragungen zu einem Thema als Repräsentativ in
einer Gesellschaft gesehen wird. 10.000 "Bewerter" würden als das
Gesamtergebnis sogar nochmals um das 10-Fache verbessern.
@uzimmi
"Ich glaube die Antwort auf diese Frage zu kennen:
Diese 10.000 "human evaluators" wird die Gesamtanzahl weltweit sein?!
Wie viele davon sprechen die passende Landessprache (z.B. Deutsch),
um
Seiteninhalte bewerten zu können?"
Die Landessprache dürfte kein Problem darstellen. Wer etwas nicht
versteht, kann es auch schlecht bewerten. Diese Fehlertoleranz ist bei
einem "Blindbewerter" eher als "unrelevant" einzustufen. Auch wäre es
Goolge sicherlich problemlos möglich, die Bewertungen entsprechend der
einzelnen Ländern entsprechend anzubieten. Die Nationalität wird ja
auch schon jetzt von Google bei Zugriff automatisch abgefragt und kann
auch problemlos eindeutig identifiziert werden.
Also für solch eine Bewertungsmöglichkeit könnte man sich doch
wirklich begeistern, oder?
Problematisch wird dabei sicherlich der zusätzliche Datenaufwand und
die Kontrolle einer möglichen böswilligen Manipulation durch Dritte
sein. Denn es dürfte ja nur eine Stimme pro Webseite durch die Person
in einem bestimmten Zeitraum abgegeben werden.
So sehen wir, dass die Umsetzung dieser Idee in die Praxis sicherlich
sehr schwierig sein dürfte, weil eine Minderheit existiert, die
grundsätzlich versucht, böswillig ihre Vorteile aus solch einem System
für sich selbst zu ziehen
Leute, wir können uns glaube diese Diskussion der Bewertungen von
einzelnen Webseiten durch User ersparen :-)
Gerade einmal bei Google geprüft - "Informatikerinstinkt" :-)
Google wertet bereits die Klicks auf Ergebnisse aus:
"onmousedown="return clk([Parameter])
Damit behaupte ich, fliesen diese "Clicks" und "Refs" wohl auch in
die Gesamtbewertung der Webseite ein. Denn wenn Daten erhoben werden
und bestehen, verwende ich diese auch.
ich hatte luzie so verstanden, dass die Manpower bei der Bewertung von
Google bereitgestellt wird. Und die Frage ist auch, wie schnell
positive/negative Änderungen an Seiten zu einer modifizierten
Bewertung führen.
Dass Google die Klicks auf die Ergebnisse erfasst ist m.W. schon
länger bekannt. Nur was bringt die Auswertung dieser Statistik? Seiten
die ohnehin vorne stehen werden natürlich häufiger aufgerufen als
weiter hinten stehende. Dazu wird dann die Verweildauer ermittelt -
kommt der User zurück auf die Ergebnisliste und wählt ein anderes
Element der Liste? Hier kann man nur über die schiere Menge zu
halbwegs brauchbaren Ergebnissen kommen, die aber immer dann schlecht
sind, wenn alle Ergebnisse nicht dem entsprechen, was der Nutzer
gesucht hat (entnervtes Aufgeben beim letzten Element, das dann mit
einer langen Verweildauer gezählt wird?!). Ein vielleicht noch
besseres weiter hinten stehendes Ergebnis wird dagegen nicht
aufgerufen, weil die Mehrheit der Nutzer mit einem davor stehenden
Ergebnis zufrieden war oder schon vorher aufgegeben hat? OK, hier
würde es helfen, gelegentlich die Reihenfolge zu verändern, um die
Statistik auf ein aussagekräftig(er)es Fundament zu stellen.
Um all das machen zu können muss dennoch ein Automatismus zunächst
ermitteln, was weiter vorne platziert wird!
jep, stimme deinem beitrag im vollen umfang zu. leider ist es wirklich
ein problem, dass "richtiges suchen" durch user bis heute nicht
begriffen wurde.
"weil die Mehrheit der Nutzer mit einem davor stehenden
Ergebnis zufrieden war oder schon vorher aufgegeben hat"
denn wer nach der ergebnisseite 3 schon mit seiner suche aufhört, dem
ist wohl nicht klar, wieviel millionen webseiten sich mit einem
bestimmten thema beschäftigen und diese logischer weise nicht alle auf
pos 1 befinden können.
die eingrenzung einer suche ist also dabei sehr relevant und die
richtige kombination der keywords.
aber die auswertung der klicks auf ein ergebnis ist schon einmal sehr
hilfreich und mit der sogenannten "sandbox" wird ja auch sicherlich
die von dir gemeinte möglichkeit eingeräumt, einer neuen webseite die
chance zu ermöglichen, durch erhaltene klicks nach vorne zu rücken und
die "vermutete" position damit zu bestätigen.
Keywords spielen bei google doch schon lange keine Rolle mehr und ich
glaube auch, dass Webkataloge zum Teil wirklich Zeitverschwendung der
Betreiber ist, denn google bestimmt als "Oligopol-Monopolist", welcher
als "gut" und welcher als "schlecht" zu bewerten ist. Im eigenen Hause
allerdings ist man nicht bemüht, Webkataloge in Szene zu setzen. Wie
schon jemand vor mir schrieb, google sahnt ab und die Arbeit leisten
die anderen.
Im Übrigen habe ich etwas dagegen, dass der Suchalgorithmus von google
komplett unter Verschluss gehalten wird. Ja, das gleicht schon einer
Art der Zensur, denn ebenfalls wie Microsoft, das seine Quellcodes
komplett unter Verschluss halten, denken sich Idealisten in deren
Programmierstil ein und schenken im Prinzip Microsoft die für den User
so wichtigen Servicepacks. Dolle Wurst.
> jep, stimme deinem beitrag im vollen umfang zu. leider ist es wirklich
> ein problem, dass "richtiges suchen" durch user bis heute nicht
> begriffen wurde.
> "weil die Mehrheit der Nutzer mit einem davor stehenden
> Ergebnis zufrieden war oder schon vorher aufgegeben hat"
> denn wer nach der ergebnisseite 3 schon mit seiner suche aufhört, dem
> ist wohl nicht klar, wieviel millionen webseiten sich mit einem
> bestimmten thema beschäftigen und diese logischer weise nicht alle auf
> pos 1 befinden können.
> die eingrenzung einer suche ist also dabei sehr relevant und die
> richtige kombination der keywords.
> aber die auswertung der klicks auf ein ergebnis ist schon einmal sehr
> hilfreich und mit der sogenannten "sandbox" wird ja auch sicherlich
> die von dir gemeinte möglichkeit eingeräumt, einer neuen webseite die
> chance zu ermöglichen, durch erhaltene klicks nach vorne zu rücken und
> die "vermutete" position damit zu bestätigen.
>>> OK, hier würde es helfen, gelegentlich die Reihenfolge
>>> zu verändern, um die Statistik auf ein aussagekräftig(er)es
>>> Fundament zu stellen.
nicht nur das!
eine rotation der positionen in den SERPs hätte noch weitere vorteile,
besonders nämlich eine gewisse aufhebung der starren linearität, bei
den meisten abfragen ist absolut nicht mehr zu begründen, warum eine
site auf platz 17 steht, die andere aber auf platz 7, die (manchmal
jahrelang) wie einbetonierte widerlogische positionierungsreihenfolge
ist wahrlich ein graus aus der steinzeit der informatik, über die
logik eines mittleren taschenrechners kommen und kommen sie einfach
nicht hinaus.
MSN ( http://www.live.com/ ) dagegen scheint inzwischen tatsächlich
rotation der suchergebnispositionen zu verwenden. sehr klug ist das!
Wir können schon leichte Rotationen bei den SERPs beobachten. Gewisse
keys werden von uns täglich / wöchentlich / monatlich gemessen. Daher
können wir sagen, dass bestimmte Positionen nicht festgezimmert sind.
Da tut sich ständig was. Wie stark die Schwankung ist, hängt mE davon
ab, welchen charakter das file hat. News, Artikel,
Objektbeschreibung, kommerzielles Angebot, etc...?
> >>> OK, hier würde es helfen, gelegentlich die Reihenfolge
> >>> zu verändern, um die Statistik auf ein aussagekräftig(er)es
> >>> Fundament zu stellen.
> nicht nur das!
> eine rotation der positionen in den SERPs hätte noch weitere vorteile,
> besonders nämlich eine gewisse aufhebung der starren linearität, bei
> den meisten abfragen ist absolut nicht mehr zu begründen, warum eine
> site auf platz 17 steht, die andere aber auf platz 7, die (manchmal
> jahrelang) wie einbetonierte widerlogische positionierungsreihenfolge
> ist wahrlich ein graus aus der steinzeit der informatik, über die
> logik eines mittleren taschenrechners kommen und kommen sie einfach
> nicht hinaus.
> MSN (http://www.live.com/) dagegen scheint inzwischen tatsächlich
> rotation der suchergebnispositionen zu verwenden. sehr klug ist das!