seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
Gestern wurde die Site ca. 3 mal komplett mit allen Unterseiten über den
Tag verteilt durchsucht, was über 500 Zugriffe waren. Jetzt sehe ich
gerade, dass das heute so weiter geht. Irgendwie ist mir das ja schon
unheimlich, da Google sich sonst immer aller ein bis zwei Wochen mal
umgeschaut hat.
Geht das nur uns so oder ist das anderen auch schon aufgefallen?
m.m
--
Englische Grammatik Online - http://www.ego4u.de
Seitdem T-Onliner nicht mehr googeln dürfen, hat der Bot plötzlich
ungeahnte Bandbreite zur Verfügung, und weiss noch nicht genau was
er damit anfangen soll.
Gruss, Michael
> Geht das nur uns so oder ist das anderen auch schon aufgefallen?
Mir ist auch irgendwie aufgefallene, daß Googlebot ziemlich oft
unterwegs ist:
bei 'Top 15 von 1055 Anwenderprogramme' steht G.B. an dritte Stelle:
|3 4765 5.96% Googlebot/2.1 (+http://www.googlebot.com/bot.html)
--
Grüße, Huschiar Madjidi . www.netandmore.de
>Konfuzius sprach: "Wenn ein Mann es bis vierzig immer noch nicht
>geschafft hat, sich beliebt zu machen, so wird sich das auch bis zu seinem
>Lebensende nicht mehr aendern."
> > Geht das nur uns so oder ist das anderen auch schon aufgefallen?
>
> Seitdem T-Onliner nicht mehr googeln dürfen, hat der Bot plötzlich
> ungeahnte Bandbreite zur Verfügung, und weiss noch nicht genau was
> er damit anfangen soll.
Abgesehen davon, daß diese Behauptung so nicht stimmt (zumindest die
1+1-Kunden, die irgendwie auch zu dem Verein gehören sind davon nicht
betroffen...), glaube ich nicht, daß die T-Onliner weltweit gesehen
auf einmal so wichtig sind, daß G.B. nun 'Däumchen' drehen muß...:-)
Viel mehr stelle anhand der Statistiken auf netandmore.de, daß G.B. im
letzten Monat genauso oft unterwegs war:
|2 7343 9.20% Googlebot/2.1 (+http://www.googlebot.com/bot.html)
--
Grüße, Huschiar Madjidi . www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>Konfuzius sprach: "Menschen, mit denen Du Wissen austauschst, sind
>nicht unbedingt auch die, mit deren Prinzipien Du uebereinstimmst".
> Geht das nur uns so oder ist das anderen auch schon aufgefallen?
Google war gestern das letzte Mal bei mir.
Servus,
Konni
> seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
Ich kenn jemand, der dein Problem gerne hätte.
Stimmt's www.jendryschik.de?
Gruß Steffi
> > seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
>
> Ich kenn jemand, der dein Problem gerne hätte.
Wenn es wirklich zu einem 'Problem' werden sollte, könnte man sich
sogar über häufige Besuche 'beschweren':
http://www.google.com/bot.html#howoften
|How often will Googlebot access my web pages?
|For most sites, Googlebot should not access your site more than once
|every few seconds on average. Since network delays are involved it is
|possible over short periods the rate will appear to be slightly higher.
|If you find that we are placing too high a load on your site, please let
|us know by sending us e-mail at goog...@google.com.
Ich rate allerdings jedem davon ab, so etwas zu machen.
--
Grüße, Huschiar Madjidi. http://www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>Konfuzius sprach: "Wer mit Worten schamlos auftrumpft, der wird
>es später schwer haben, diesen Worten auch Taten folgen zu lassen."
Gerüchten zufolge steigt die Frequenz mit wachsendem Pagerank. Aber...
> Gestern wurde die Site ca. 3 mal komplett mit allen Unterseiten über
> den Tag verteilt durchsucht,
... dreimal am Tag ist irgendwie nicht normal. Hast du anhand der
IP-Adressen geprüft, ob es wirklich von Google kommt, oder gehst du nur
nach dem UserAgent?
> Geht das nur uns so oder ist das anderen auch schon aufgefallen?
Hier siehts noch normal aus, außer daß heute wohl Robots-Tag ist
(Googlebot, Scooter und Slurp geben sich grad die Klinke in die Hand)...
usch
> ... dreimal am Tag ist irgendwie nicht normal. Hast du anhand der
> IP-Adressen geprüft, ob es wirklich von Google kommt, oder gehst du nur
> nach dem UserAgent?
Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
> Gerüchten zufolge steigt die Frequenz mit wachsendem Pagerank. Aber...
Der Rank ist seit mindestens zwei Monaten schon auf 6/10, hat sich also
in den letzten Tagen nichts auffallend geändert.
> ... dreimal am Tag ist irgendwie nicht normal. Hast du anhand der
> IP-Adressen geprüft, ob es wirklich von Google kommt, oder gehst du
> nur nach dem UserAgent?
Ich gehe zwar nur nach dem UA, logge aber die IPs mit und die stammen
wirklich alle von Google. Ist ein bunter Mischmasch aus 216.239.46.x
und 64.68.82.x
> Hier siehts noch normal aus, außer daß heute wohl Robots-Tag ist
> (Googlebot, Scooter und Slurp geben sich grad die Klinke in die
> Hand)...
Ja, Scooter und Slurp sind auch aktiver als sonst. Die wollen wohl alle
Firefly Konkurenz machen, da der auch täglich mehrmals alles
durchsucht.
Na ja, was soll's. Besser als wenn die Bots einen Bogen um die Seite
machen ;-)
> Ich kenn jemand, der dein Problem gerne hätte.
Na als Problem will ich das mal nicht bezeichnen. Solange noch mehr
Besucher als Bots auf der Seite sind, ist es mir egal ;o) Hat mich halt
nur gewundert, dass sich der Googlebot mit einem Schlag so ins Zeug
legt.
Nö, aber bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
jedes ScriptKid.
usch
> Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
Der UA-String laesst sich doch beliebig aendern.
Viele Gruesse
Can Filip Sakrak
--
Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/
F.A.Q. zu Webauthoring : http://www.dciwam.de/faq/
F.A.Q. zum Posten : http://www.learn.to/quote/
Oeffentl. Usenetarchiv : http://groups.google.com/
> > Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
>
> Nö, aber bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
> jedes ScriptKid.
Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?
--
Grüße, Huschiar Madjidi . http://www.netandmore.de
>wir lassen Sie nicht allein. mit Ihnen gemeinsam führen wir in Ihrem haus
>die systemtests durch. wenn Sie es wünschen. optimieren und integrieren
>wir Sie in das gesamtsystem. (teltakt: standard for telephone numbers)
> |* Uwe Schröder in de.comm.infosystems.www.authoring.misc wrote:
>
> > bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
> > jedes ScriptKid.
>
> Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?
Zum Beispiel jemand, der gerne schnell an die Informationen auf einer
Site kommt, statt sich mit irgendwelchem albernen Klickibunti- und
Flash-Scheiß herumzuschlagen. Gerüchten zufolge gibt es zahlreiche
Websites, bei denen Googlebots und ähnliche richtiggehend mit
Informationen überhäuft werden.
Wirsing!
ltrebing
--
The first time you'll get a Microsoft product that doesn't suck will be
the day they start producing vacuum cleaners.
Lars Trebing | http://www.ltrebing.de/ | mailto:ltre...@ltrebing.de
^^^^
Das gehört da eigentlich nicht hin. :)
Mein Vorschlag: Mario setzt auf seine Startseite einen Link zu Michael.
Sobald der wieder im Google-Verzeichnis steht, sind alle glücklich, und
der Link kann auch wieder weg. ;)
> Ich rate allerdings jedem davon ab, so etwas zu machen.
Warum ;-)?
Servus,
Konni
(SCNR)
> Der Rank ist seit mindestens zwei Monaten schon auf 6/10, hat sich also
> in den letzten Tagen nichts auffallend geändert.
Ähm, eine Verständnisfrage: Wie erfährst Du Deinen PageRank, was
bedeutet 6/10 in etwa, und könnte für mich den jemand mal ermitteln ;-)?
> Ja, Scooter und Slurp sind auch aktiver als sonst. Die wollen wohl alle
> Firefly Konkurenz machen, da der auch täglich mehrmals alles
> durchsucht.
>
> Na ja, was soll's. Besser als wenn die Bots einen Bogen um die Seite
> machen ;-)
Ack.
Servus,
Konni
> > Ich rate allerdings jedem davon ab, so etwas zu machen.
>
> Warum ;-)?
Ich gebe ja zu, daß meine Bemerkung eigentlich überflüssig war, denn
so etwas ist doch selbstverständlich. Um allerdings jede weitere
Diskussion aus dem Weg zu gehen, habe ich das so formuliert.
Warum? Nun ja, angenommen hätten die Postboten zusätzlich die Aufgabe
gehabt zu sehen ob Dein Geschäft noch existiert oder nicht und Du
hättest einen Schild draußen gehängt: "bitte nicht so oft besuchen,
das stört mich und meine Fußmatte wird auch unnötig abgenutzt", hätte
ich Dich für ein miserablen Geschäftsmann gehalten...;-)
--
Grüße, Huschiar Madjidi . http://www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>the requested URL was not found on this server the link you followed is either
>outdated, inaccurate, or the server has been instructed not to let you have it
> > Der Rank ist seit mindestens zwei Monaten schon auf 6/10, hat sich also
> > in den letzten Tagen nichts auffallend geändert.
>
> Ähm, eine Verständnisfrage: Wie erfährst Du Deinen PageRank, was
> bedeutet 6/10 in etwa, und könnte für mich den jemand mal ermitteln ;-)?
<neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>
http://toolbar.google.com/intl/de/
|System-Anforderungen
|Microsoft Windows 95/98/ME/NT/2000/XP
|Microsoft Internet Explorer Version 5 oder später
--
Grüße, Huschiar Madjidi . www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>"The days of somebody saying, 'Shut up and play' are over."- ZARIN MEHTA
> Warum? Nun ja, angenommen hätten die Postboten zusätzlich die Aufgabe
> gehabt zu sehen ob Dein Geschäft noch existiert oder nicht und Du
> hättest einen Schild draußen gehängt: "bitte nicht so oft besuchen,
> das stört mich und meine Fußmatte wird auch unnötig abgenutzt", hätte
> ich Dich für ein miserablen Geschäftsmann gehalten...;-)
Bitte jetzt in Klartext den Bogen zu den Suchmaschinen schlagen - es
wird noch unverständlicher als vorher...
Servus,
Konni
> <neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>
"Ziemlich hoch"? Ich dachte, dass das bei 7/10 anfangen wuerde. Oder ist
dass schon "sehr hoch"?
> <neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>
Danke für den Neid. Aber was *bedeutet* 5/10? Ist das gut? Was wäre
besser?
> http://toolbar.google.com/intl/de/
>
> |System-Anforderungen
> |Microsoft Windows 95/98/ME/NT/2000/XP
> |Microsoft Internet Explorer Version 5 oder später
Rrrrrrrrrrrgnagnagna... Ich hab hier kein Windows...
Konni,
der sein iBook trotzdem mag.
> Ähm, eine Verständnisfrage: Wie erfährst Du Deinen PageRank,
Das werdet ihr MACies nie verstehen. man google Toolbar.
> was bedeutet 6/10 in etwa,
befriedigend.
> und könnte für mich den jemand mal ermitteln ;-)?
www.roterochs.de - 5/10
www.roter-ochs.de - 0/10
Gruß Steffi
> Bitte jetzt in Klartext den Bogen zu den Suchmaschinen schlagen - es
> wird noch unverständlicher als vorher...
Wie soll denn eine Suchmaschine Dich indexieren und das auch möglichst
aktuell halten, wenn er Dich nur gelegentlich und auf Bestellung
besuchen darf?
Und wozu haben wir eine FAQ:
http://www.netandmore.de/faq/fom-serve/cache/1060.html#1-2
> > seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
>
> Ich kenn jemand, der dein Problem gerne hätte.
>
> Stimmt's www.jendryschik.de?
Du legst deinen Finger in meine Wunde, drehst das Messer in
ihr, streust Salz in sie hinein. Du trittst auf einen am
Boden liegenden ein. Du versetzt mir den Dolchstoß, erfreust
dich an meinem Unglück. Du trittst auf einen am Boden liegenden
ein. Du versetzt mir den Dolchstoß, erfreust dich an meinem
Unglück. Wer den Schaden hat, braucht für den Spott nicht zu
sorgen.
Du hast gut reden. Ein Mensch, der immer nur war satt, versteht
nunmal nicht den, der Hunger hat. Aber ich komme damit klar.
Auch ohne Butter schmeckt das Brot, das lernt man sehr gut in
der Not. Das Leben ist schließlich kein Wunschkonzert.
MI
> > <neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>
>
> "Ziemlich hoch"? Ich dachte, dass das bei 7/10 anfangen wuerde. Oder ist
> dass schon "sehr hoch"?
Naja, man könnte damit zufrieden sein, für mich ist 5/10 für eine
private Seite ziemlich hoch, aber für eine Seite wie www.gmx.de (6/10)
wohl zu niedrig.
Zum Vergleich:
> Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/ 5/10
> F.A.Q. zu Webauthoring : http://www.netandmore.de/faq/ 6/10
> F.A.Q. zum Posten : http://www.learn.to/quote/ 6/10
> Oeffentl. Usenetarchiv : http://groups.google.com/ 10/10
Wie objektiv solche Wertungen sind kann ich allerdings nicht
beurteilen. IMHO ist es nur ein Barometer, selbst ein Barometer kann
kaputt sein und die Leute (ent)täuschen...
--
> > seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
>
> Ich kenn jemand, der dein Problem gerne hätte.
>
> Stimmt's www.jendryschik.de?
Du legst deinen Finger in meine Wunde, drehst das Messer in
ihr, streust Salz in sie hinein. Du trittst auf einen am
Boden liegenden ein. Du versetzt mir den Dolchstoß, erfreust
dich an meinem Unglück. Wer den Schaden hat, braucht für den
> Du legst deinen Finger in meine Wunde, drehst das Messer in
> ihr, streust Salz in sie hinein. [...]
Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
besucht wird? Ich habe da irgendwas verpasst...
Viele Gruesse
Can Filip "ausquetsch" Sakrak
--
Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/
F.A.Q. zu Webauthoring : http://www.dciwam.de/faq/
F.A.Q. zum Posten : http://www.learn.to/quote/
Oeffentl. Usenetarchiv : http://groups.google.com/
> > Du legst deinen Finger in meine Wunde, drehst das Messer in
> > ihr, streust Salz in sie hinein. [...]
>
> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
> besucht wird?
Den Webhoster gewechselt.
MI
> > Du legst deinen Finger in meine Wunde, drehst das Messer in
> > ihr, streust Salz in sie hinein. [...]
>
> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
> besucht wird? Ich habe da irgendwas verpasst...
Den Webhoster gewechselt.
Relativ gut besucht wird die Seite nach wie vor. Google hat mir
etwa 60 Besucher pro Tag gebracht, die sind jetzt natürlich weg.
MI
>> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
>> besucht wird? Ich habe da irgendwas verpasst...
>
> Den Webhoster gewechselt.
>
> Relativ gut besucht wird die Seite nach wie vor. Google hat mir
> etwa 60 Besucher pro Tag gebracht, die sind jetzt natürlich weg.
Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
Monat. Totaler Einbruch der Abrufe.
pi
Oh ja. Ich bin Anfang des Jahres beim selben Hoster nur auf einen
anderen Server umgezogen. Glücklicherweise hab ich auf den alten Server
immer noch Zugriff und konnte den alten Inhalt (wenn auch nicht mehr
aktualisiert) dort liegenlassen, sodaß die Anfrage beim falschen Server
wenigstens keinen Errorcode zur Folge hatte und ich nicht komplett aus
dem Index geflogen bin.
Es hat ewig gedauert, bis die Bots die neue IP-Adresse gefressen hatten,
anscheinend haben sie einen ziemlich langlebigen IP-Cache - Googlebot
eine Woche, Slurp zwei Wochen. Der hartnäckigste war AskJeeves, der hat
6 Wochen gebraucht und ich weiß bis heute noch nicht, ob er freiwillig
gegangen ist oder ob ich ihn mithilfe des 409er-Status verscheucht habe,
den ich schließlich nur noch zurückgeliefert habe. Aber der ist eh
merkbefreit und will heute noch Seiten haben, die es seit mindestens
einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
auf den "neuen" URL ab... *grunz*
usch
> Wie soll denn eine Suchmaschine Dich indexieren und das auch möglichst
> aktuell halten, wenn er Dich nur gelegentlich und auf Bestellung
> besuchen darf?
Wenn eine Suchmaschine *zu oft* kommt, und *heavy load* auf der Seite
produziert, dann ist es m.E. auch ok, dass zu sagen.
Nein, ich werde das nicht tun ;-)
Servus,
Konni
> Das werdet ihr MACies nie verstehen. man google Toolbar.
durchgelesen.
> > was bedeutet 6/10 in etwa,
>
> befriedigend.
Jetzt die ultimative Frage, dann gebe ich Ruhe. Jede Seite kann doch
eigentlich nur zu bestimmten Themen "kompetent" sein (eigentlich ist es
ja der Autor), wie kann man dann einen "universalen" PageRank ermitteln?
> > und könnte für mich den jemand mal ermitteln ;-)?
>
> www.roterochs.de - 5/10
> www.roter-ochs.de - 0/10
Klar. Die zweite zeigt ja auf die selbe IP, wird nur
nie verlinkt.
Servus,
Konni
> Es hat ewig gedauert, bis die Bots die neue IP-Adresse gefressen hatten,
> anscheinend haben sie einen ziemlich langlebigen IP-Cache - Googlebot
> eine Woche, Slurp zwei Wochen.
Das hat bei mir und Google wesentlich laenger gebraucht.
> Der hartnäckigste war AskJeeves, der hat
> 6 Wochen gebraucht und ich weiß bis heute noch nicht, ob er freiwillig
> gegangen ist oder ob ich ihn mithilfe des 409er-Status verscheucht habe,
> den ich schließlich nur noch zurückgeliefert habe. Aber der ist eh
> merkbefreit und will heute noch Seiten haben, die es seit mindestens
> einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
> auf den "neuen" URL ab... *grunz*
So ist es. Und dennoch werden die alten Seiten immer noch im Ergebnis
ausgeliefert:-(
pi
> Danke für den Neid. Aber was *bedeutet* 5/10? Ist das gut? Was wäre
> besser?
Je höher, um so besser. 6/10 ist als besser, 7/10 noch besser, ...
> Rrrrrrrrrrrgnagnagna... Ich hab hier kein Windows...
Sei froh.
m.m
--
Englische Grammatik Online - http://www.ego4u.de
> "Ziemlich hoch"? Ich dachte, dass das bei 7/10 anfangen wuerde. Oder
> ist dass schon "sehr hoch"?
Mit unseren 6/10 sind wir bei fast allen relevanten Suchwörtern weit
oben, wenn nicht gar an erster Stelle vertreten.
> Jetzt die ultimative Frage, dann gebe ich Ruhe. Jede Seite kann doch
> eigentlich nur zu bestimmten Themen "kompetent" sein (eigentlich ist es
> ja der Autor), wie kann man dann einen "universalen" PageRank ermitteln?
Diese Frage ist hier sehr gut erklärt:
http://www.google.de/intl/de/why_use.html
|PageRank verlässt sich auf die einzigartige demokratische Natur des World
|Wide Webs, indem es die weitverzweigte Link-Struktur als einen Indikator
|für die individuelle Einschätzung der Qualität einer Seite nimmt.
usw.
--
Grüße, Huschiar Madjidi . www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
> Zum Beispiel jemand, der gerne schnell an die Informationen auf einer
> Site kommt, statt sich mit irgendwelchem albernen Klickibunti- und
> Flash-Scheiß herumzuschlagen. Gerüchten zufolge gibt es zahlreiche
> Websites, bei denen Googlebots und ähnliche richtiggehend mit
> Informationen überhäuft werden.
Mich würde mal interessieren, ob sich der Googlebot auch manchmal als
normaler Browser ausgibt um solche Seiten zu entlarven.
> |PageRank verlässt sich auf die einzigartige demokratische Natur des World
> |Wide Webs, indem es die weitverzweigte Link-Struktur als einen Indikator
> |für die individuelle Einschätzung der Qualität einer Seite nimmt.
Also tatsächlich völlig unabhängig vom Thema.
Nun ist mir klar, wo die Probleme liegen:
- nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
sein können
- neue Seiten haben *sehr* schwer
- verlinkte Seiten können nach Änderung schlechter werden,
beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
ohne dass die Linksetzenden und damit Google das mitkriegen.
Servus,
Konni
> Also tatsächlich völlig unabhängig vom Thema.
>
> Nun ist mir klar, wo die Probleme liegen:
>
> - nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
> sein können
> - neue Seiten haben *sehr* schwer
> - verlinkte Seiten können nach Änderung schlechter werden,
> beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
> ohne dass die Linksetzenden und damit Google das mitkriegen.
Jo, deshalb hat auch Google manchmal haarstäubende Ergebnisse.
> - nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
> sein können
Bedenke bitte, daß die 'gute' Seiten sehr schnell und gerne verlinkt
und zitiert werden. Aber wie definiert man 'gut'? Viel mehr denke ich,
daß eine Seite für die Besucher wichtig und unverzichtbar sein muß.
Letztendlich spielen hier nur die Inhalte eine Rolle, diese können
Informationen sein (spiegel.de 8/10), oder auch wichtige Tools und
Updates (microsoft 8/10).
> - neue Seiten haben *sehr* schwer
Nur für kurze Zeit am Anfang, sobald man die 'verborgenen Schätze' und
somit die Werte der Seite entdeckt hat, werden Sie eben gerne verlinkt
und so wandern Sie ganz nach oben.
> - verlinkte Seiten können nach Änderung schlechter werden,
> beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
> ohne dass die Linksetzenden und damit Google das mitkriegen.
Wenn Sie inhaltlich schlechter werden und damit weniger wichtig, dann
auf jeden Fall.
--
Grüße, Huschiar Madjidi . www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>Konfuzius sprach: "Es gibt nur wenig Fälle, in denen Menschen einen
>Fehler damit begangen haben, sich in einer Sache selbst zu beschränken."
> Selbst http://bjoern.hoehrmann.de/ hat 6/10...
Ich habe das Gefuehl, dass "outgoing links" staerker als Linkverweise
auf die entsprechende Seite gewertet werden. [1]
Viele Gruesse
Can Filip Sakrak
________
[1] http://de.webmasterplan.com/cgi-local/router.cgi?l=de&p=wmpde&s=mon_linkpop
--
Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/
F.A.Q. zu Webauthoring : http://www.dciwam.de/faq/
F.A.Q. zum Posten : http://www.learn.to/quote/
Oeffentl. Usenetarchiv : http://groups.google.com/
Selbst http://bjoern.hoehrmann.de/ hat 6/10...
> Jetzt die ultimative Frage, dann gebe ich Ruhe. Jede Seite kann doch
> eigentlich nur zu bestimmten Themen "kompetent" sein (eigentlich ist
> es ja der Autor), wie kann man dann einen "universalen" PageRank
> ermitteln?
Der Pagerank dient ja nicht dazu, die Relevanz einer Seite zu
beurteilen. Der Pagerank wird verwendet, um die gefundenen relevanten
Seiten zu sortieren.
Bei der Suche nach "pfngz" taucht yahoo.com gar nicht auf, obwohl
yahoo.com einen Pagerank von 10/10 hat. Bei der Suche nach "finance"
dagegen landet finance.yahoo.com (9/10) auf Platz 1 vor cnn.com (9/10)
und dem japanischen Ministry of Finance (7/10).
Gruß Steffi
> Der Pagerank dient ja nicht dazu, die Relevanz einer Seite zu
> beurteilen. Der Pagerank wird verwendet, um die gefundenen relevanten
> Seiten zu sortieren.
Ahso. Danke für die Erläuterung.
Ich vermute mal, dass ob der Dichte meines Genres (es gibt *wahnsinnig*
viele Gasthäuser im Web) die Links sich wohl etwas sehr verteilen.
Servus,
Konni
On 8/1/2002 3:03 PM Boris 'pi' Piwinger schrieb:
[..]
>
> Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
> Monat. Totaler Einbruch der Abrufe.
Tschuldigung wenn ich Dauschen mal dazwischen tröte.
Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?
Dachte das geht über die URL. Auch ich hatte den Provider gewechselt und
mich über den geringen Besucherstrom gewundert. Dabei sind die Seiten
mit den gleichen Suchbegriffen nach wie vor zu finden.
*verwirrtguggt* Wie hängt das denn zusammen, oder habe ich euch hier gar
gar falsch verstanden.
[1]
Wusste nicht mal das sich die IP ändert bei einem Providerumzug. Aber
irgendwie logisch wenn ich nun drüber nachdenke. Schließlich ist das Web
nun ja auch physikalisch auf einem anderem System. Nicht mehr in der
Karlstraße in Köln, sondern in der Meiergasse in Frankfurt, sozu sagen
neue Adresse.
--
MfG - Lupus Göbel
Der Sumpf und Morasthobbybastler und Anfänger mit
Wissensdurst (http://www.lupusdw.de)
> Mich würde mal interessieren, ob sich der Googlebot auch manchmal als
> normaler Browser ausgibt um solche Seiten zu entlarven.
Ich wuerde es nicht ausschliessen. :-)
Viele Gruesse
Can Filip Sakrak
--
>> Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
>> Monat. Totaler Einbruch der Abrufe.
>
> Tschuldigung wenn ich Dauschen mal dazwischen tröte.
> Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?
Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
verwenden, der wesentlich laenger speichert als er soll.
pi
On 8/1/2002 7:25 PM Boris 'pi' Piwinger schrieb:
[...]
>> Tschuldigung wenn ich Dauschen mal dazwischen tröte.
>> Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?
>
> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
> verwenden, der wesentlich laenger speichert als er soll.
Aha, heißt: Die speichern nicht nur die URL sondern die IP-Adresse einer
Seite. Geben aber die gespeicherte URL wieder als Suchergebniss aus.
Kann man das so verstehen?
Aber was hat das dann mit dem Ergebnis der Suchmaschine zu tun? Das
bleibt sich doch gleich?
Beim Klick auf dir URL wird man doch an die richtige Stelle verwiesen.
--
MfG - Lupus Göbel
Mh, ich glaube ich werde nicht weiter versuchen es zu verstehen. Werde
mich lieber weiter um meine Tabellenlöschungen kümmern.
>>> Tschuldigung wenn ich Dauschen mal dazwischen tröte.
>>> Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?
>>
>> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
>> verwenden, der wesentlich laenger speichert als er soll.
>
> Aha, heißt: Die speichern nicht nur die URL sondern die IP-Adresse einer
> Seite. Geben aber die gespeicherte URL wieder als Suchergebniss aus.
> Kann man das so verstehen?
Nein. Die betreiben natuerlich DNS-Server, wie jeder andere auch. Nur,
dass deren DNS-Server "etwas" mehr Stress hat als andere;-) Daher wird
er wohl so manipuliert, dass er ueber die Masse hinaus die IP-Adresse
vormerkt. Wird dann eine Seite ueberprueft, wird der DNS-Server
gefragt, der aber die Aenderung nicht mitbekommt. Also wird der
flasche Rechner angesprochen.
Interessanterweise ist mein letzter Umzug wesentlich besser verlaufen,
da gab es AFAICS keine Probleme.
pi
> Ich vermute mal, dass ob der Dichte meines Genres (es gibt
> *wahnsinnig* viele Gasthäuser im Web) die Links sich wohl
> etwas sehr verteilen.
Ich hab so das Gefühl, dir passt das nicht, dass du "nur" 5/10 hast?
Bekommst den Hals wohl nicht voll genug?
5/10 ist für eine Seite wie die deine ein sehr respektables Ergebnis.
Vergleiche dich mit den besten Restaurants Deutschlands:
traube-tonbach.de 0/10
residenz-heinz-winkler.de 4/10
im-schiffchen.com 2/10
schlosshotel-lerbach.com 4/10
Was willst mehr?
Gruß Steffi
On 8/1/2002 7:35 PM Boris 'pi' Piwinger schrieb:
[..]
>>
>> Aha, heißt: Die speichern nicht nur die URL sondern die IP-Adresse
>> einer Seite. Geben aber die gespeicherte URL wieder als
>> Suchergebniss aus. Kann man das so verstehen?
>
> Nein. Die betreiben natuerlich DNS-Server, wie jeder andere auch.
> Nur, dass deren DNS-Server "etwas" mehr Stress hat als andere;-)
Gibt es da nicht was von Ratziofarm? *g*
> Daher wird er wohl so manipuliert, dass er ueber die Masse hinaus die
> IP-Adresse vormerkt. Wird dann eine Seite ueberprueft, wird der
> DNS-Server gefragt, der aber die Aenderung nicht mitbekommt. Also
> wird der flasche Rechner angesprochen.
Nun habe ich es verstanden.
>
> Interessanterweise ist mein letzter Umzug wesentlich besser
> verlaufen, da gab es AFAICS keine Probleme.
Sach doch, spielt viel zu viel Zufall mit als das man dabei 100% Regeln
aufstellen kann.
Recht herzlichen Dank.
--
MfG - Lupus Göbel
> Ich hab so das Gefühl, dir passt das nicht, dass du "nur" 5/10 hast?
> Bekommst den Hals wohl nicht voll genug?
So ist es :-) Du vermutest richtig.
Ich merk das schon bei meiner Nelli: Frauen haben ein gutes Gespür für
Sachen, die hinter dem Gesagten stehen :))
> 5/10 ist für eine Seite wie die deine ein sehr respektables Ergebnis.
> Vergleiche dich mit den besten Restaurants Deutschlands:
>
> traube-tonbach.de 0/10
> residenz-heinz-winkler.de 4/10
> im-schiffchen.com 2/10
> schlosshotel-lerbach.com 4/10
>
> Was willst mehr?
Das willst Du nicht wirklich wissen. Aber ich glaube, ich werde es
schaffen.
Servus,
Konni
Genauer gesagt ist der PageRank ein Sortierkriterium unter vielen, und
nicht mal das wichtigste. Wo ein Stichwort genau vorkommt (im Titel, in
Überschriften, im Dateiname, im Domainnamen) und wie oft es vorkommt ist
z.B. entscheidender. So können dann auch relativ "unbedeutende" (zumindest
wenig verlinkte) Seiten zu einem Erst-Ranking auf der Trefferliste führen.
Beispielsweise wenn man als Sucher verschiedene Stichworte angibt, und
sich aus denen eine Phrase bilden lässt, die sich auf einer indexierten
Seite findet, so ist das bedeutender, als wenn eine andere Seite einen
hohen PageRank und ansonsten bloss die Stichworte enthält.
Somit haben also auch Seiten der Kategorie "klein, neu, unbekannt, aber
relevant" eine Chance, solange sie nur einmal verlinkt sind und Google
drüber gegangen ist (ein paar Monate muß man natürlich schon warten in der
Regel).
Und wer seinen PageRank erhöhen will... http://dmoz.org ist ein guter
Anfang. Was hier gelistet wird taucht nach ca. einem halben Jahr auf 100en
von Seiten auf (d.H. nachdem ein Redakteur es akzeptiert hat und die
ganzen Suchkataloge ihre Daten an Hand des Open Directory aktualisiert
haben).
Ansonsten ist der PageRank wohl die Sache, bei der man sich am wenigstens
Gedanken machen muß, weil man auch am wenigsten Einfluß hat.
(Titel-Optimierungen usw. kann man ja einfach selbst vornehmen.)
Trotzdem für mehr Details interessant:
PageRank Explained
http://www.goodlookingcooking.co.uk/PageRank.pdf
> Google war gestern das letzte Mal bei mir.
<link rel="help"/>
Was heißt "das letzte Mal"? Hast Du ihn ausgesperrt? Oder willst Du
damit sagen, daß er einfach nur häufig vorbeikommt?
Lars Kasper (über eine dciw.search nachdenkend)
> Was heißt "das letzte Mal"? Hast Du ihn ausgesperrt? Oder willst Du
> damit sagen, daß er einfach nur häufig vorbeikommt?
Ja, so ist es.
Gefällt mir.
Seltsamerweise spidert er Seiten, die dann aber mit wochenlanger
Verzögerung erst gefunden werden.
> Lars Kasper (über eine dciw.search nachdenkend)
Finde ich nicht gut. Es ist dermaßen verwoben mit dem, was Du auf die
Seite schreibst, dass _eine_ Gruppe für beides ausreicht und eher das
Gruppentopic geändert werden sollte, damit es Suchmaschinenfragen mit
einschließt.
Servus,
Konni
> |How often will Googlebot access my web pages?
>
> |For most sites, Googlebot should not access your site more than once
> |every few seconds on average.
Und wenn's mehr wird, darf man sich beschweren ...
--
Why is it that an author can write a book faster than an agent can read it?
[G. Miki Hayden]
> ber der ist eh
> merkbefreit und will heute noch Seiten haben, die es seit mindestens
> einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
> auf den "neuen" URL ab... *grunz*
Och, Google hat nicht mehr existierende Seiten teilweise auch recht
lange im Cache ...
--
"So habe ich das vor Jahren von einem Mitzivi mit italienischer Mama
gelernt: Kochzeit _ mindestens_ vier Stunden.
Isse nix Rezept Mama Miraculi, aufbass!" /in de.alt.fan.aldi
Hartmut 'Hardy' Schiszler in <a9sp6i.3...@ID-82801.user.dfncis.de>
> Lars Trebing wrote on Donnerstag, 1. August 2002 12:48:
>
>> Zum Beispiel jemand, der gerne schnell an die Informationen auf einer
>> Site kommt, statt sich mit irgendwelchem albernen Klickibunti- und
>> Flash-Scheiß herumzuschlagen. Gerüchten zufolge gibt es zahlreiche
>> Websites, bei denen Googlebots und ähnliche richtiggehend mit
>> Informationen überhäuft werden.
>
> Mich würde mal interessieren, ob sich der Googlebot auch manchmal als
> normaler Browser ausgibt um solche Seiten zu entlarven.
In de.admin.net-abuse.misc gab es mal einen Fall, wo jemand
massenweise Doorway-Pages zu einem Amazon-Partneraccount gelegt
hat. Mit Referer (=das sind die Besucher, die die Seite über
Suchmaschine gefunden haben) kam man zu Amazon (mit Partner-ID,
natürlich), ohne kam wohl ne Menge Stoff für den Google-Bot. Das hatte
da jemand getestet, an User-Agent-Sensitivität kann ich mich nicht
erinnern, vielleicht hat er das auch bloß nicht getestet.
--
"Ganz einfach: Ich habe selten viel mehr als 50 EUR in Bar bei mir." - "???
Wieso? Bist du noch minderjährig und bekommst so wenig Taschengeld? Oder hast
du Angst, die Islamisten könnten dich ausrauben?" Andreas Mauerer und Konrad
Wilhelm in <3saubukbi99vu94nh...@4ax.com> in de.alt.fan.aldi
> > merkbefreit und will heute noch Seiten haben, die es seit mindestens
> > einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
> > auf den "neuen" URL ab... *grunz*
>
> Och, Google hat nicht mehr existierende Seiten teilweise auch recht
> lange im Cache ...
Das ist ein Unterschied, ob sie die Seiten noch als Archiv vorrätig
haben oder ob ein Spider immer wieder danach fragt, obwohl er jedesmal
gesagt bekommt, daß es die Seite nicht mehr gibt.
Googlebot fragt AFAIK nach einem 301 kein zweites Mal nach der Seite, es
sei denn, irgendwo in der weiten Welt gibt es noch einen falsch
gesetzten Link, dem er gefolgt ist.
usch
--
Any feature is a bug unless it can be turned off. (Heuer's Law, 1990)
[pagerank Anzeige google taskbar]
> Wie objektiv solche Wertungen sind kann ich allerdings nicht
> beurteilen. IMHO ist es nur ein Barometer, selbst ein Barometer kann
> kaputt sein und die Leute (ent)täuschen...
> - nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
> sein können
Ja. Es ist allerdings kaum denkbar, das wirklich gute Seiten
in akzeptablen Zeiträumen nicht auch eingehende Links
bekommen, daher...
> - neue Seiten haben *sehr* schwer
...gilt dies nicht lange. (Du erinnerst Dich an unsere
Fachsimpelei...?)
> - verlinkte Seiten können nach Änderung schlechter werden,
> beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
> ohne dass die Linksetzenden und damit Google das mitkriegen.
Jein. Wenn (unabhängig von der Qualität der Inhaltes) Seiten
durch Pixelschubser unzugänglich gemacht werden, kann Google
da auch nix mehr indizieren. Dann hat Google nur noch die
eingehenden Links und deren Texte. Mehr nicht.
<glaskugel>Die Seiten werden runtergestuft oder verschwinden
im Extremfall völlig aus der Datenbank.</glaskugel>
Google kriegt das schon mit, wenn er den Links nicht mehr
sinnvoll folgen kann. Wenn trotzdem noch 2000 Leute darauf
linken, dann wird Google voraussichtlich mindestens die URL
in der Datenbank halten. Ich kenne da einige Firmen, bei
denen die URL dem Firmennamen entspricht. Fütterst Du Google
damit, kommt die (unzugängliche) Startseite auf Platz eins.
Fügst Du ein relevantes Suchwort (zB ein Produkt
der Firma) hinzu, sind sie weg.
Gruss Rainer
Ich verstehe das nicht. Nie nicht. So einen Fall hatte ich
noch nie. Und ich habe etliche Umzüge hinter mir bzw.
betreut.
Den umgekehrten Fall hatte ich allerdings schon mehrfach:
Nach einem Umzug von $massenbillighoster zu
$richtigem_hoster war die Position bei Google plötzlich
deutlich besser.
IMO kann das nur irjendswie mit den beteiligten
Hostern zusammenhängen. Aber wie...?
Gruss Rainer
Besagter Tester war meinereiner, und bei fehlendem Referer war es
User-Agent-sensitiv ("Mozilla" im User-Agent führte zu einem gefaketen
404, vermutlich um zu verhindern, daß jemand bei Google das Spamming
bemerkt, wenn er nach einem Hinweis einfach die URL in seinen Browser
pastet).
Details siehe <slrna9v3pl...@falsche.message-ids.sind-doof.de>
Andreas
--
Andreas Ferber - dev/consulting GmbH - Bielefeld, FRG
---------------------------------------------------------
+49 521 1365800 - a...@devcon.net - www.devcon.net
> Der Pagerank dient ja nicht dazu, die Relevanz einer Seite zu
> beurteilen. Der Pagerank wird verwendet, um die gefundenen relevanten
> Seiten zu sortieren.
Richtig. Anderes Beispiel: "google.de Kontakt". Die erste
Google-eigene Seite erscheint erst auf Platz 6.
Hihihi.
Rainer
> Selbst http://bjoern.hoehrmann.de/ hat 6/10...
Kein Wunder. ;-)
Kipp doch mal "link:bjoern.hoehrmann.de" bei Google rein.
Und Du hast sehr viele gute ausgehende Links, u.a. auf
bjoernsworld.de. ;-)
Gruss Rainer
> Ich habe das Gefuehl, dass "outgoing links" staerker als Linkverweise
> auf die entsprechende Seite gewertet werden. [1]
Glaubichnich.
>> Ich habe das Gefuehl, dass "outgoing links" staerker als Linkverweise
>> auf die entsprechende Seite gewertet werden. [1]
> Glaubichnich.
Das habe ich jedenfalls geglaubt, als ich feststellen durfte, dass
[1] hoeher als [2] gewertet wird, obwohl auf [2] oefters verwiesen wird.
Natuerlich spielen auch incoming links und Inhaltsmenge eine Rolle.
[3] hat 6/10 (alle Inhalte nur im Mitgliederbereich und somit vor Robots
geschuetzt) und [4] 10/10...
Daraus ergibt sich wahrscheinlich folgende Reihenfolge:
- outgoing links
- incoming links
- content / interne Verlinkungsstruktur
Viele Gruesse
Can Filip Sakrak
________
[1] http://bjoern.hoehrmann.de/
[2] http://spamabwehr.sakrak.net/
[3] http://www.gmx.de/
[4] http://www.w3c.org/
>> Google war gestern das letzte Mal bei mir.
>
><link rel="help"/>
>
>Was heißt "das letzte Mal"? Hast Du ihn ausgesperrt? Oder willst Du
>damit sagen, daß er einfach nur häufig vorbeikommt?
>
>
>Lars Kasper (über eine dciw.search nachdenkend)
Wie ich bereits vor einiger Zeit in
<3d360e78...@news.jendryschik.de> vorschlug. Wirklich viele von
euch haben sich dazu jedoch nicht geäußert, vor allem auch, da Björn mit
seinem Vorschlag zur kompletten Reorganisation abgelenkt (aber seitdem
nichts mehr dafür unternommen) hat. Vielleicht frage ich in einigen
Wochen in dciwam und dciwpm noch einmal nach, ob Interesse an einer
solchen Gruppe besteht.
MI
--
: Michael Jendryschik : mic...@jendryschik.de : http://jendryschik.de/ :
: Einführung in (X)HTML, CSS und Webdesign http://jendryschik.de/wsdev/ :
: Monatlich das Beste aus de.alt.netdigest http://best-of-netdigest.de/ :
>Das habe ich jedenfalls geglaubt, als ich feststellen durfte, dass
>[1] hoeher als [2] gewertet wird, obwohl auf [2] oefters verwiesen wird.
Ein wesentlicher Punkt ist eben auch der PR der eingehenden Links
(weniger aber qualitativ hochwertigere Links bringen eventuell mehr)
sowie der Text, mit dem auf etwas verwiesen wird.
Suchst Du nach "KEYWORD", und es wird per <a
href="http://deinesite">KEYWORD</a> von irgendwo (mit möglichst hohem
PR) auf Deine Seite verwiesen, hilft das bei der speziellen Suche nach
KEYWORD sehr, wenn KEYWORD sonst nicht (oder kaum) auf der Seite
auftaucht.
[...]
>Daraus ergibt sich wahrscheinlich folgende Reihenfolge:
>
> - outgoing links
> - incoming links
> - content / interne Verlinkungsstruktur
Ich kann nicht ganz folgen, wieso die Reihenfolge? Und inwiefern
fließt der Content bei der Berechnung des PR ein?
Gruß,
Marco
>>Naja, man könnte damit zufrieden sein, für mich ist 5/10 für eine
>>private Seite ziemlich hoch, aber für eine Seite wie www.gmx.de (6/10)
>>wohl zu niedrig.
>
>Selbst http://bjoern.hoehrmann.de/ hat 6/10...
Deine Seite bezeichne ich auch nicht unbedingt als eine reine
Privatseite, dort sind nützliche Informationen plaziert und das wird
belohnt.
Ich glaube, daß Alan mit 7/10 bei 'uns' an der höchste Stelle steht...
--
Grüße, Huschiar Madjidi . http://www.netandmore.de
>You may visit the ghetto-museum. guides tours available. open daily.
>our special advice: after the visit go and stroll through the older
>parts of the village in order to restore your calm.
--
mfG.
Marco Stielow
> Huschiar Madjidi(Huschiar Madjidi) meinte am 1.08.2002:
^^^^^^^^^^^^^^^^
Warum erscheint hier mein Name doppelt? Vielleicht falsche
Reader-Einsetllungen?
> [pagerank Anzeige google taskbar]
> > Wie objektiv solche Wertungen sind kann ich allerdings nicht
> > beurteilen. IMHO ist es nur ein Barometer, selbst ein Barometer kann
> > kaputt sein und die Leute (ent)täuschen...
>
> http://pr.efactory.de/d-pagerank-implementierung.shtml
Interessanter Artikel, daraus kannst Du zwar nicht erkennen, wie
objektiv solche Wertungen sind, aber die Funktionsweise ist gut
erklärt.
--
Grüße, Huschiar Madjidi . http://www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>the requested URL was not found on this server the link you followed is either
>outdated, inaccurate, or the server has been instructed not to let you have it
> Suchst Du nach "KEYWORD", und es wird per <a
> href="http://deinesite">KEYWORD</a> von irgendwo (mit möglichst hohem
> PR) auf Deine Seite verwiesen, hilft das bei der speziellen Suche nach
> KEYWORD sehr, wenn KEYWORD sonst nicht (oder kaum) auf der Seite
> auftaucht.
Mit dem main keyword "spamabwehr" ist meine Website ja auch auf Platz 1.
> Ich kann nicht ganz folgen, wieso die Reihenfolge? Und inwiefern
> fließt der Content bei der Berechnung des PR ein?
Ich denke, dass es auf die qualitative Menge ankommt.
Viele Gruesse
Can Filip Sakrak
--
> http://pr.efactory.de/d-pagerank-implementierung.shtml
Ah. Danke für den Link.
Servus,
Konni
> |* Uwe Schröder in de.comm.infosystems.www.authoring.misc wrote:
>
> > > Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
> >
> > Nö, aber bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
> > jedes ScriptKid.
>
> Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?
Schau mal in die Diskussion hier "Suchmaschinenfreundlich?" vom Februar,
Thread ab MID:<a58f8s$kki$1...@rks1.urz.tu-dresden.de>.
Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten heraus, die
Spamdexing betreiben und (bis heute) noch nicht von Google aus der DB
rausgeworfen worden sind :-(
Bsp.:
http://www.google.de/search?q=Meinersdorf+Kirchen+Tannroda+Groitzsch
Und mit dem ersten Hit (jeder andere funktioniert sicher auch):
lynx als UA:googlebot http://www5.private- flirt- erotikkontakte.de/
ueberblick8_stat.html
"... Gays Callgirls Callboys Meinersdorf Kirchen Tannroda Groitzsch Schiphorst |
Kontaktanzeigen Swingerclubs Sex Bordelle..." identisch mit dem Google-Ergebnis.
ohne UA: googlebot das übliche für Bots Unlesbare:
<html><head><title></title></head>
<frameset ...>
<frame frameborder=0 ... SRC="http://www.kontaktanzeigenmarkt24. de/" ...>
<frame frameborder=0 ... marginwidth=0 marginheight=0 Scrolling=no noresize>
</frameset></html>
noch Fragen?
Wolfgang
mit seinen Verweisen zu Beobachtungen der letzten Sonnenfinsternis in
Mitteleuropa immer noch hervorrgand placi^H^Hzie^H^H^Htziert.
>> Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
>> Monat. Totaler Einbruch der Abrufe.
>
> Ich verstehe das nicht. Nie nicht. So einen Fall hatte ich
> noch nie. Und ich habe etliche Umzüge hinter mir bzw.
> betreut.
Tja, ich hatte zwei Umzuege. Der erste war halt wirklich uebel. Der
zweite unbemerkt. Vielleicht haben sie was angepasst.
> Den umgekehrten Fall hatte ich allerdings schon mehrfach:
> Nach einem Umzug von $massenbillighoster zu
> $richtigem_hoster war die Position bei Google plötzlich
> deutlich besser.
>
> IMO kann das nur irjendswie mit den beteiligten
> Hostern zusammenhängen. Aber wie...?
Rein spekulativ: Sie koennten die Spider bzgl. der Anzahl der Aufrufe
in bestimmten Netzen (Class Irgendwas) pro Zeiteinheit beschraenkt haben.
pi
> Ist Dir bewußt, daß dies im Gegensatz zu vielen Quellen
> steht, denenzufolge, outgoing links den page rank vermindern?
Das scheint mir unzulaessig verkuerzt.
> Demnach sollte ich klarstellen, ob ich Dich richtig
> verstanden habe: Du meinst: Wenn eine Seite A einen Link auf
> eine andere Seite B enthält, kann das den Rank von A erhöhen?
Waere jedenfalls sinnvoll, da die Technologie zwei Arten von Seiten
identifizieren sollte: Authorities und Hubs.
> Hat das irgendwie mit dem Rank von B zu tun?
Das waere dann zwingend.
pi
[de.comm.infosystems.www.search]
> Vielleicht frage ich in einigen Wochen in dciwam und dciwpm
> noch einmal nach, ob Interesse an einer solchen Gruppe besteht.
Ich bitte darum.
Du könntest ja schon einmal mit einer unverbindlichen
Traffic-Auszählung beginnen ...
Lars Kasper
--
<http://larskasper.de/> persönliche Webseite
<http://dciwam.de/faq/> Webauthoring-FAQ: HTML, CSS, usw.
> Anette Stegmann wrote:
>> Demnach sollte ich klarstellen, ob ich Dich richtig
>> verstanden habe: Du meinst: Wenn eine Seite A einen Link auf
>> eine andere Seite B enthält, kann das den Rank von A erhöhen?
> Waere jedenfalls sinnvoll, da die Technologie zwei Arten von Seiten
> identifizieren sollte: Authorities und Hubs.
Ihr habt mich beide richtig verstanden.
>> Hat das irgendwie mit dem Rank von B zu tun?
> Das waere dann zwingend.
Korrekt.
Viele Gruesse
Can Filip Sakrak
--
> > Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?
>
> Schau mal in die Diskussion hier "Suchmaschinenfreundlich?" vom Februar,
> Thread ab MID:<a58f8s$kki$1...@rks1.urz.tu-dresden.de>.
Erleuchtend...:-)
> Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten heraus, die
> Spamdexing betreiben und (bis heute) noch nicht von Google aus der DB
> rausgeworfen worden sind :-(
Traurig zu wissen, danke für den Hinweis.
--
Grüße, Huschiar Madjidi . http://www.netandmore.de
>wir lassen Sie nicht allein. mit Ihnen gemeinsam führen wir in Ihrem haus
>die systemtests durch. wenn Sie es wünschen. optimieren und integrieren
>wir Sie in das gesamtsystem. (teltakt: standard for telephone numbers)
Ich bin geneigt, darauf zu wetten. Die Schmutzbuckel, die
dem googlebot andere Seiten ausliefern als sonst, werden
bestimmt nicht von Hand aussortiert.
Gruss Rainer
> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
> verwenden, der wesentlich laenger speichert als er soll.
Aha?
Weisst Du da mehr drüber? Irgendwelche Quellen?
Gruss Rainer
> Das willst Du nicht wirklich wissen. Aber ich glaube, ich werde es
> schaffen.
Das Schlimme ist: Es ist ihm zuzutrauen.
> Ich bin geneigt, darauf zu wetten. Die Schmutzbuckel, die
> dem googlebot andere Seiten ausliefern als sonst, werden
> bestimmt nicht von Hand aussortiert.
Kann man nur hoffen, dass die Leute von Google auffällige Seiten vorher
dann trotzdem noch mal anschauen. Google und andere Robots bekommen bei
mir nämlich keine Session-ID, wodurch ein automatisches System durchaus
fälschlicherweise Spaming vermuten könnte.
m.m
--
Englische Grammatik Online - http://www.ego4u.de
>> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
>> verwenden, der wesentlich laenger speichert als er soll.
>
> Aha?
>
> Weisst Du da mehr drüber? Irgendwelche Quellen?
Wie ich bereits schrieb, war das deutlich zu beobachten. Zugriffe
unter der alten IP (Parallelbetrieb des Servers fuer einige Tage).
pi
> > Das willst Du nicht wirklich wissen. Aber ich glaube, ich werde es
> > schaffen.
>
> Das Schlimme ist: Es ist ihm zuzutrauen.
Witzbold, *DU* hast mich ja erst draufgebracht.
@Steffi: Vorsicht, Rainer kann was. Wird Zeit, dass Du ihn kennenlernst.
Sebastian hatte sich schon so auf Euer Zusammentreffen gefreut, leider
hat es dann nicht geklappt.
Servus,
Konni
> > Huschiar Madjidi(Huschiar Madjidi) meinte am 1.08.2002:
> ^^^^^^^^^^^^^^^^
>
> Warum erscheint hier mein Name doppelt?
Zur Sicherheit...?
> Vielleicht falsche Reader-Einsetllungen?
Nö. Tendenziell suboptimale Programierung. Ich nix
Quellcode.
> > [pagerank Anzeige google taskbar]
> > http://pr.efactory.de/d-pagerank-implementierung.shtml
> Interessanter Artikel, daraus kannst Du zwar nicht erkennen, wie
> objektiv solche Wertungen sind, aber die Funktionsweise ist gut
> erklärt.
Ebendst.
Gruss Rainer
> Huschiar Madjidi <hus...@gmx.de> writes:
> > |How often will Googlebot access my web pages?
> >
> > |For most sites, Googlebot should not access your site more than once
> > |every few seconds on average.
und bei inktomi steht:
| Frequency of accesses: Slurp should not access your site more than
| once every five seconds on average. Since network delays are involved
| it is possible over short periods the rate will appear to be slightly
| higher, but the average frequency should remain below once per minute.
> Und wenn's mehr wird, darf man sich beschweren ...
Hmm, Google und viele andere Bots üben in letzter Zeit häufigst das
Crawlen mehrfach am Tag (seit ca. 4 - 5 Monaten). Auch auf Verzeichnisse
zuzugreifen ohne den üblichen Slash am Ende, Beispiel:
www.meineseite.de/verzeichnis anstelle von
www.meineseite.de/verzeichnis/
bekommt jedesmal 301 zurück mit der richtigen Schreibweise...
Neuerdings mehren sich die Zugriffe mit und _ohne_ "www." am Beginn der
URL, togal...
Google-Beispiele:
2.8. bis zum Frühstück <gr> 4 Verzeichnisse gelesen, plus robots.txt
1.8. robots.txt, Verzeichnis1 zweimal in 1 Stunde gelesen
plus Seite gelesen, die er nicht sollte (nofollow)
31.7. robots.txt 3mal
Verzeichnis1 4mal richtig (plus mehrfach ohne Slash)
Verzeichnis2 1mal richtig (plus 6mal ohne Slash)
interessant noch
27.7. in der Zeit 11:56 bis 28.7. 07:00 (unsere Zeit)
Verzeichnis1 25mal ohne Slash, erst am 28.7./07:00 richtig! ;-)
ziemlich blöder Bot ;-) auch wenn ich gern bei Google suche...
Aus einer Antwort auf eine Beschwerde bei inktomi wegen zu häufigem
Crawlen:
| Basically we are crawlling *millions* of sites on a daily basis.
| The program that is hitting your site is accessing what *it*
| thinks is a site once a week. If it is visiting your *server*
| more than once a week, that is usually a sign that it thinks that
| is more than one site at that IP address (or IP addresses).
|
| That said, we have multiple hosts performing the same function,
| so you may be visited as many as seven times in one week (once
| by each host). Are multiple hosts accesing your site multiple
| times a day, or just si3002.inktomi.com?
jep, aus IP-Range...
66.196.65.xxx 8 IPs
66.196.72.xxx 3 IPs
66.196.73.xxx 2 IPs
manche kommen mit Slurp/SI, manche mit Slurp/cat ;-)
| I'll take a closer look at your original email and see what else
| I can tell you about what you're seeing.
Slurp schafft die robots.txt bis zu 3mal in 30 Minuten, und 6 Stunden
später besteht schon wieder Interesse ;-/
Grüsse von
Jürgen
> > Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
>
> Der UA-String laesst sich doch beliebig aendern.
Und die IP auch? ;-)
Grüsse von
Jürgen
> > Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten
> > heraus, die Spamdexing betreiben und (bis heute) noch nicht
> > von Google aus der DB rausgeworfen worden sind :-(
> http://www.google.com/contact/spamreport.html
Ach :-( Aus der damaligen Diskussion:
Von: Michael Nahrath Datum:2002-02-24 15:37:05 PST
| Eine Suche nach "Meinersdorf Kirchen Tannroda Groitzsch" führt sogar zu
| 32 fast identischen Seiten.
...
| Beschwerde an Google ist raus.
Und von mir damals auch. Sie sollten sie wenigstens als "sponsored Links"
kennzeichnen :-((
Gruß
Wolfgang
> Und die IP auch? ;-)
Das macht nur bei DoS-Attacken Sinn.
Viele Gruesse
Can Filip "bitte kein xpost nach d.o.c." Sakrak
Nun, woher soll denn Google auch wissen, dass http://www.meineseite.de
und http://meineseite.de identisch sind?
Und bei den Zugriffen ohne Slash hat sicherlich jemand auf genau diesen
URL verlinkt. Eventuell speichert Google diese URLs nicht, so dass der
Bot jedes Mal neu nachsehen muss.
Claus
--
------------------------ http://www.faerber.muc.de/ ------------------------
OpenPGP: DSS 1024/639680F0 E7A8 AADB 6C8A 2450 67EA AF68 48A5 0E63 6396 80F0
Wäre auch sinnvoll, um ein Netz oder einen Server[1] nicht zu
überlasten.
Claus
___________________
[1] Bei Billighostern können auch recht viele (virtuelle) Server auf ein
und derselben IP-Adresse laufen.
> Das macht nur bei DoS-Attacken Sinn.
^^^^^ ^^^^
Das ist kein Deutsch. "To make sense" ist ein englischer Ausdruck, der
z. B. als "sinnvoll sein" oder "Sinn ergeben" ins Deutsche übersetzt
werden kann.
Wirsing!
ltrebing
Followup gesetzt, bitte beachten!
--
The first time you'll get a Microsoft product that doesn't suck will be
the day they start producing vacuum cleaners.
Lars Trebing | http://www.ltrebing.de/ | mailto:ltre...@ltrebing.de
[Google boykottiert nach Umzug]
> Rein spekulativ: Sie koennten die Spider bzgl. der Anzahl der Aufrufe
> in bestimmten Netzen (Class Irgendwas) pro Zeiteinheit beschraenkt haben.
Nur, wenn jemand umzieht? Und auch nur einige Seiten, andere
nicht?
Glaubichnich.
Gruss Rainer
Hm... Nun, wenn er die alte IP kennt, und darüber immer noch
Antworten bekommt, finde "einige Tage" nicht auffällig.
Gruss Rainer
> {2002-08-02 10:48} "Wolfgang Ewert":
>> Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten
>> heraus, die Spamdexing betreiben und (bis heute) noch nicht
>> von Google aus der DB rausgeworfen worden sind :-(
> Siehe auch:
> http://www.google.com/contact/spamreport.html
http://www.google.com/search?sourceid=navclient&q=abuse+kleeneze
Die ersten zwei sind immer noch top-of-the-list obwohl google bereits
auf den Report geantwortet hat. (Hidden Text Spamming)
cu
mgk
--
Man nennt es Lawine. Der Berg ruft nicht, er kommt persönlich.