Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Google und kein Ende

0 views
Skip to first unread message

Mario Mueller

unread,
Jul 31, 2002, 9:53:08 PM7/31/02
to
Hi

seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
Gestern wurde die Site ca. 3 mal komplett mit allen Unterseiten über den
Tag verteilt durchsucht, was über 500 Zugriffe waren. Jetzt sehe ich
gerade, dass das heute so weiter geht. Irgendwie ist mir das ja schon
unheimlich, da Google sich sonst immer aller ein bis zwei Wochen mal
umgeschaut hat.

Geht das nur uns so oder ist das anderen auch schon aufgefallen?

m.m

--
Englische Grammatik Online - http://www.ego4u.de

Michael Hermes

unread,
Aug 1, 2002, 2:24:51 AM8/1/02
to
Mario Mueller wrote:
>
> Hi
>
> seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
> Gestern wurde die Site ca. 3 mal komplett mit allen Unterseiten über den
> Tag verteilt durchsucht, was über 500 Zugriffe waren. Jetzt sehe ich
> gerade, dass das heute so weiter geht. Irgendwie ist mir das ja schon
> unheimlich, da Google sich sonst immer aller ein bis zwei Wochen mal
> umgeschaut hat.
>
> Geht das nur uns so oder ist das anderen auch schon aufgefallen?

Seitdem T-Onliner nicht mehr googeln dürfen, hat der Bot plötzlich
ungeahnte Bandbreite zur Verfügung, und weiss noch nicht genau was
er damit anfangen soll.

Gruss, Michael

Huschiar Madjidi

unread,
Aug 1, 2002, 2:32:49 AM8/1/02
to
|* Mario Mueller in de.comm.infosystems.www.authoring.misc wrote:

> Geht das nur uns so oder ist das anderen auch schon aufgefallen?

Mir ist auch irgendwie aufgefallene, daß Googlebot ziemlich oft
unterwegs ist:

bei 'Top 15 von 1055 Anwenderprogramme' steht G.B. an dritte Stelle:

|3 4765 5.96% Googlebot/2.1 (+http://www.googlebot.com/bot.html)

--
Grüße, Huschiar Madjidi . www.netandmore.de
>Konfuzius sprach: "Wenn ein Mann es bis vierzig immer noch nicht
>geschafft hat, sich beliebt zu machen, so wird sich das auch bis zu seinem
>Lebensende nicht mehr aendern."

Huschiar Madjidi

unread,
Aug 1, 2002, 2:43:36 AM8/1/02
to
|* Michael Hermes in de.comm.infosystems.www.authoring.misc wrote:

> > Geht das nur uns so oder ist das anderen auch schon aufgefallen?
>
> Seitdem T-Onliner nicht mehr googeln dürfen, hat der Bot plötzlich
> ungeahnte Bandbreite zur Verfügung, und weiss noch nicht genau was
> er damit anfangen soll.

Abgesehen davon, daß diese Behauptung so nicht stimmt (zumindest die
1+1-Kunden, die irgendwie auch zu dem Verein gehören sind davon nicht
betroffen...), glaube ich nicht, daß die T-Onliner weltweit gesehen
auf einmal so wichtig sind, daß G.B. nun 'Däumchen' drehen muß...:-)

Viel mehr stelle anhand der Statistiken auf netandmore.de, daß G.B. im
letzten Monat genauso oft unterwegs war:

|2 7343 9.20% Googlebot/2.1 (+http://www.googlebot.com/bot.html)

--
Grüße, Huschiar Madjidi . www.netandmore.de

"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>Konfuzius sprach: "Menschen, mit denen Du Wissen austauschst, sind
>nicht unbedingt auch die, mit deren Prinzipien Du uebereinstimmst".

Konni Scheller

unread,
Aug 1, 2002, 3:34:59 AM8/1/02
to
Mario Mueller <nos...@ego4u.de> wrote:

> Geht das nur uns so oder ist das anderen auch schon aufgefallen?

Google war gestern das letzte Mal bei mir.

Servus,
Konni

Steffi Abel

unread,
Aug 1, 2002, 4:48:24 AM8/1/02
to
"Mario Mueller" <nos...@ego4u.de> schrieb:

> seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.

Ich kenn jemand, der dein Problem gerne hätte.

Stimmt's www.jendryschik.de?

Gruß Steffi

Huschiar Madjidi

unread,
Aug 1, 2002, 5:10:33 AM8/1/02
to
|* Steffi Abel in de.comm.infosystems.www.authoring.misc wrote:

> > seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
>
> Ich kenn jemand, der dein Problem gerne hätte.

Wenn es wirklich zu einem 'Problem' werden sollte, könnte man sich
sogar über häufige Besuche 'beschweren':

http://www.google.com/bot.html#howoften

|How often will Googlebot access my web pages?

|For most sites, Googlebot should not access your site more than once
|every few seconds on average. Since network delays are involved it is
|possible over short periods the rate will appear to be slightly higher.
|If you find that we are placing too high a load on your site, please let
|us know by sending us e-mail at goog...@google.com.

Ich rate allerdings jedem davon ab, so etwas zu machen.

--
Grüße, Huschiar Madjidi. http://www.netandmore.de


"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/

>Konfuzius sprach: "Wer mit Worten schamlos auftrumpft, der wird
>es später schwer haben, diesen Worten auch Taten folgen zu lassen."

Uwe Schröder

unread,
Aug 1, 2002, 5:11:20 AM8/1/02
to
Mario Mueller <nos...@ego4u.de> schrieb:

>
> seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.

Gerüchten zufolge steigt die Frequenz mit wachsendem Pagerank. Aber...

> Gestern wurde die Site ca. 3 mal komplett mit allen Unterseiten über
> den Tag verteilt durchsucht,

... dreimal am Tag ist irgendwie nicht normal. Hast du anhand der
IP-Adressen geprüft, ob es wirklich von Google kommt, oder gehst du nur
nach dem UserAgent?

> Geht das nur uns so oder ist das anderen auch schon aufgefallen?

Hier siehts noch normal aus, außer daß heute wohl Robots-Tag ist
(Googlebot, Scooter und Slurp geben sich grad die Klinke in die Hand)...

usch

Huschiar Madjidi

unread,
Aug 1, 2002, 5:22:18 AM8/1/02
to
|* Uwe Schröder in de.comm.infosystems.www.authoring.misc wrote:

> ... dreimal am Tag ist irgendwie nicht normal. Hast du anhand der
> IP-Adressen geprüft, ob es wirklich von Google kommt, oder gehst du nur
> nach dem UserAgent?

Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?

Mario Mueller

unread,
Aug 1, 2002, 5:35:31 AM8/1/02
to
Uwe Schröder wrote on Donnerstag, 1. August 2002 11:11:

> Gerüchten zufolge steigt die Frequenz mit wachsendem Pagerank. Aber...

Der Rank ist seit mindestens zwei Monaten schon auf 6/10, hat sich also
in den letzten Tagen nichts auffallend geändert.

> ... dreimal am Tag ist irgendwie nicht normal. Hast du anhand der
> IP-Adressen geprüft, ob es wirklich von Google kommt, oder gehst du
> nur nach dem UserAgent?

Ich gehe zwar nur nach dem UA, logge aber die IPs mit und die stammen
wirklich alle von Google. Ist ein bunter Mischmasch aus 216.239.46.x
und 64.68.82.x

> Hier siehts noch normal aus, außer daß heute wohl Robots-Tag ist
> (Googlebot, Scooter und Slurp geben sich grad die Klinke in die
> Hand)...

Ja, Scooter und Slurp sind auch aktiver als sonst. Die wollen wohl alle
Firefly Konkurenz machen, da der auch täglich mehrmals alles
durchsucht.

Na ja, was soll's. Besser als wenn die Bots einen Bogen um die Seite
machen ;-)

Mario Mueller

unread,
Aug 1, 2002, 5:38:09 AM8/1/02
to
Steffi Abel wrote on Donnerstag, 1. August 2002 10:48:

> Ich kenn jemand, der dein Problem gerne hätte.

Na als Problem will ich das mal nicht bezeichnen. Solange noch mehr
Besucher als Bots auf der Seite sind, ist es mir egal ;o) Hat mich halt
nur gewundert, dass sich der Googlebot mit einem Schlag so ins Zeug
legt.

Uwe Schröder

unread,
Aug 1, 2002, 5:52:35 AM8/1/02
to
Huschiar Madjidi <hus...@gmx.de> schrieb:

>
> Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?

Nö, aber bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
jedes ScriptKid.

usch

Can Filip Sakrak

unread,
Aug 1, 2002, 5:59:49 AM8/1/02
to
Huschiar Madjidi schrieb:

> Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?

Der UA-String laesst sich doch beliebig aendern.

Viele Gruesse
Can Filip Sakrak

--
Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/
F.A.Q. zu Webauthoring : http://www.dciwam.de/faq/
F.A.Q. zum Posten : http://www.learn.to/quote/
Oeffentl. Usenetarchiv : http://groups.google.com/

Huschiar Madjidi

unread,
Aug 1, 2002, 6:43:06 AM8/1/02
to
|* Uwe Schröder in de.comm.infosystems.www.authoring.misc wrote:

> > Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
>
> Nö, aber bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
> jedes ScriptKid.

Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?

--
Grüße, Huschiar Madjidi . http://www.netandmore.de
>wir lassen Sie nicht allein. mit Ihnen gemeinsam führen wir in Ihrem haus
>die systemtests durch. wenn Sie es wünschen. optimieren und integrieren
>wir Sie in das gesamtsystem. (teltakt: standard for telephone numbers)

Lars Trebing

unread,
Aug 1, 2002, 6:48:38 AM8/1/02
to
Huschiar Madjidi wrote:

> |* Uwe Schröder in de.comm.infosystems.www.authoring.misc wrote:
>
> > bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
> > jedes ScriptKid.
>
> Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?

Zum Beispiel jemand, der gerne schnell an die Informationen auf einer
Site kommt, statt sich mit irgendwelchem albernen Klickibunti- und
Flash-Scheiß herumzuschlagen. Gerüchten zufolge gibt es zahlreiche
Websites, bei denen Googlebots und ähnliche richtiggehend mit
Informationen überhäuft werden.

Wirsing!
ltrebing

--
The first time you'll get a Microsoft product that doesn't suck will be
the day they start producing vacuum cleaners.

Lars Trebing | http://www.ltrebing.de/ | mailto:ltre...@ltrebing.de

Lars Trebing

unread,
Aug 1, 2002, 6:54:21 AM8/1/02
to
Steffi Abel wrote:

^^^^
Das gehört da eigentlich nicht hin. :)

Mein Vorschlag: Mario setzt auf seine Startseite einen Link zu Michael.
Sobald der wieder im Google-Verzeichnis steht, sind alle glücklich, und
der Link kann auch wieder weg. ;)

Konni Scheller

unread,
Aug 1, 2002, 7:08:43 AM8/1/02
to
Huschiar Madjidi <hus...@gmx.de> wrote:

> Ich rate allerdings jedem davon ab, so etwas zu machen.

Warum ;-)?

Servus,
Konni
(SCNR)

Konni Scheller

unread,
Aug 1, 2002, 7:19:51 AM8/1/02
to
Mario Mueller <nos...@ego4u.de> wrote:

> Der Rank ist seit mindestens zwei Monaten schon auf 6/10, hat sich also
> in den letzten Tagen nichts auffallend geändert.

Ähm, eine Verständnisfrage: Wie erfährst Du Deinen PageRank, was
bedeutet 6/10 in etwa, und könnte für mich den jemand mal ermitteln ;-)?



> Ja, Scooter und Slurp sind auch aktiver als sonst. Die wollen wohl alle
> Firefly Konkurenz machen, da der auch täglich mehrmals alles
> durchsucht.
>
> Na ja, was soll's. Besser als wenn die Bots einen Bogen um die Seite
> machen ;-)

Ack.

Servus,
Konni

Huschiar Madjidi

unread,
Aug 1, 2002, 7:22:06 AM8/1/02
to
|* Konni Scheller in de.comm.infosystems.www.authoring.misc wrote:

> > Ich rate allerdings jedem davon ab, so etwas zu machen.
>
> Warum ;-)?

Ich gebe ja zu, daß meine Bemerkung eigentlich überflüssig war, denn
so etwas ist doch selbstverständlich. Um allerdings jede weitere
Diskussion aus dem Weg zu gehen, habe ich das so formuliert.

Warum? Nun ja, angenommen hätten die Postboten zusätzlich die Aufgabe
gehabt zu sehen ob Dein Geschäft noch existiert oder nicht und Du
hättest einen Schild draußen gehängt: "bitte nicht so oft besuchen,
das stört mich und meine Fußmatte wird auch unnötig abgenutzt", hätte
ich Dich für ein miserablen Geschäftsmann gehalten...;-)

--
Grüße, Huschiar Madjidi . http://www.netandmore.de


"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/

>the requested URL was not found on this server the link you followed is either
>outdated, inaccurate, or the server has been instructed not to let you have it

Huschiar Madjidi

unread,
Aug 1, 2002, 7:27:57 AM8/1/02
to
|* Konni Scheller in de.comm.infosystems.www.authoring.misc wrote:

> > Der Rank ist seit mindestens zwei Monaten schon auf 6/10, hat sich also
> > in den letzten Tagen nichts auffallend geändert.
>
> Ähm, eine Verständnisfrage: Wie erfährst Du Deinen PageRank, was
> bedeutet 6/10 in etwa, und könnte für mich den jemand mal ermitteln ;-)?

<neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>

http://toolbar.google.com/intl/de/

|System-Anforderungen
|Microsoft Windows 95/98/ME/NT/2000/XP
|Microsoft Internet Explorer Version 5 oder später

--
Grüße, Huschiar Madjidi . www.netandmore.de


"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/

>"The days of somebody saying, 'Shut up and play' are over."- ZARIN MEHTA

Konni Scheller

unread,
Aug 1, 2002, 7:38:57 AM8/1/02
to
Huschiar Madjidi <hus...@gmx.de> wrote:

> Warum? Nun ja, angenommen hätten die Postboten zusätzlich die Aufgabe
> gehabt zu sehen ob Dein Geschäft noch existiert oder nicht und Du
> hättest einen Schild draußen gehängt: "bitte nicht so oft besuchen,
> das stört mich und meine Fußmatte wird auch unnötig abgenutzt", hätte
> ich Dich für ein miserablen Geschäftsmann gehalten...;-)

Bitte jetzt in Klartext den Bogen zu den Suchmaschinen schlagen - es
wird noch unverständlicher als vorher...

Servus,
Konni

Can Filip Sakrak

unread,
Aug 1, 2002, 7:38:53 AM8/1/02
to
Huschiar Madjidi schrieb:

> <neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>

"Ziemlich hoch"? Ich dachte, dass das bei 7/10 anfangen wuerde. Oder ist
dass schon "sehr hoch"?

Konni Scheller

unread,
Aug 1, 2002, 7:40:24 AM8/1/02
to
Huschiar Madjidi <hus...@gmx.de> wrote:

> <neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>

Danke für den Neid. Aber was *bedeutet* 5/10? Ist das gut? Was wäre
besser?

> http://toolbar.google.com/intl/de/
>
> |System-Anforderungen
> |Microsoft Windows 95/98/ME/NT/2000/XP
> |Microsoft Internet Explorer Version 5 oder später

Rrrrrrrrrrrgnagnagna... Ich hab hier kein Windows...

Konni,
der sein iBook trotzdem mag.

Steffi Abel

unread,
Aug 1, 2002, 7:54:25 AM8/1/02
to
"Konni Scheller" <ko...@roterochs.de> schrieb:

> Ähm, eine Verständnisfrage: Wie erfährst Du Deinen PageRank,

Das werdet ihr MACies nie verstehen. man google Toolbar.

> was bedeutet 6/10 in etwa,

befriedigend.

> und könnte für mich den jemand mal ermitteln ;-)?

www.roterochs.de - 5/10
www.roter-ochs.de - 0/10

Gruß Steffi

Huschiar Madjidi

unread,
Aug 1, 2002, 8:01:23 AM8/1/02
to
|* Konni Scheller in de.comm.infosystems.www.authoring.misc wrote:

> Bitte jetzt in Klartext den Bogen zu den Suchmaschinen schlagen - es
> wird noch unverständlicher als vorher...

Wie soll denn eine Suchmaschine Dich indexieren und das auch möglichst
aktuell halten, wenn er Dich nur gelegentlich und auf Bestellung
besuchen darf?

Und wozu haben wir eine FAQ:

http://www.netandmore.de/faq/fom-serve/cache/1060.html#1-2

Michael Jendryschik

unread,
Aug 1, 2002, 8:08:40 AM8/1/02
to
"Steffi Abel" <ab...@s.netic.de> schrieb:

> > seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
>
> Ich kenn jemand, der dein Problem gerne hätte.
>
> Stimmt's www.jendryschik.de?

Du legst deinen Finger in meine Wunde, drehst das Messer in
ihr, streust Salz in sie hinein. Du trittst auf einen am
Boden liegenden ein. Du versetzt mir den Dolchstoß, erfreust
dich an meinem Unglück. Du trittst auf einen am Boden liegenden
ein. Du versetzt mir den Dolchstoß, erfreust dich an meinem
Unglück. Wer den Schaden hat, braucht für den Spott nicht zu
sorgen.
Du hast gut reden. Ein Mensch, der immer nur war satt, versteht
nunmal nicht den, der Hunger hat. Aber ich komme damit klar.
Auch ohne Butter schmeckt das Brot, das lernt man sehr gut in
der Not. Das Leben ist schließlich kein Wunschkonzert.

MI

Huschiar Madjidi

unread,
Aug 1, 2002, 8:17:23 AM8/1/02
to
|* Can Filip Sakrak in de.comm.infosystems.www.authoring.misc wrote:

> > <neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>
>
> "Ziemlich hoch"? Ich dachte, dass das bei 7/10 anfangen wuerde. Oder ist
> dass schon "sehr hoch"?

Naja, man könnte damit zufrieden sein, für mich ist 5/10 für eine
private Seite ziemlich hoch, aber für eine Seite wie www.gmx.de (6/10)
wohl zu niedrig.

Zum Vergleich:

> Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/ 5/10
> F.A.Q. zu Webauthoring : http://www.netandmore.de/faq/ 6/10
> F.A.Q. zum Posten : http://www.learn.to/quote/ 6/10
> Oeffentl. Usenetarchiv : http://groups.google.com/ 10/10

Wie objektiv solche Wertungen sind kann ich allerdings nicht
beurteilen. IMHO ist es nur ein Barometer, selbst ein Barometer kann
kaputt sein und die Leute (ent)täuschen...

--

Michael Jendryschik

unread,
Aug 1, 2002, 8:12:04 AM8/1/02
to
"Steffi Abel" <ab...@s.netic.de> schrieb:

> > seit ca. einer Woche durchsucht Google unsere Seite immer häufiger.
>
> Ich kenn jemand, der dein Problem gerne hätte.
>
> Stimmt's www.jendryschik.de?

Du legst deinen Finger in meine Wunde, drehst das Messer in


ihr, streust Salz in sie hinein. Du trittst auf einen am
Boden liegenden ein. Du versetzt mir den Dolchstoß, erfreust

dich an meinem Unglück. Wer den Schaden hat, braucht für den

Can Filip Sakrak

unread,
Aug 1, 2002, 8:41:44 AM8/1/02
to
Michael Jendryschik schrieb:

> Du legst deinen Finger in meine Wunde, drehst das Messer in

> ihr, streust Salz in sie hinein. [...]

Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
besucht wird? Ich habe da irgendwas verpasst...

Viele Gruesse
Can Filip "ausquetsch" Sakrak

--

Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/

F.A.Q. zu Webauthoring : http://www.dciwam.de/faq/

F.A.Q. zum Posten : http://www.learn.to/quote/

Oeffentl. Usenetarchiv : http://groups.google.com/

Michael Jendryschik

unread,
Aug 1, 2002, 8:56:12 AM8/1/02
to
"Can Filip Sakrak" schrieb:

> > Du legst deinen Finger in meine Wunde, drehst das Messer in
> > ihr, streust Salz in sie hinein. [...]
>
> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
> besucht wird?

Den Webhoster gewechselt.

MI

Michael Jendryschik

unread,
Aug 1, 2002, 8:57:55 AM8/1/02
to
"Can Filip Sakrak" schrieb:

> > Du legst deinen Finger in meine Wunde, drehst das Messer in
> > ihr, streust Salz in sie hinein. [...]
>
> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
> besucht wird? Ich habe da irgendwas verpasst...

Den Webhoster gewechselt.

Relativ gut besucht wird die Seite nach wie vor. Google hat mir
etwa 60 Besucher pro Tag gebracht, die sind jetzt natürlich weg.

MI

Boris 'pi' Piwinger

unread,
Aug 1, 2002, 9:03:54 AM8/1/02
to
Michael Jendryschik wrote:

>> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
>> besucht wird? Ich habe da irgendwas verpasst...
>
> Den Webhoster gewechselt.
>
> Relativ gut besucht wird die Seite nach wie vor. Google hat mir
> etwa 60 Besucher pro Tag gebracht, die sind jetzt natürlich weg.

Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
Monat. Totaler Einbruch der Abrufe.

pi

Uwe Schröder

unread,
Aug 1, 2002, 9:23:44 AM8/1/02
to
Michael Jendryschik <mic...@jendryschik.de> schrieb:

>
> > Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so
> > gut besucht wird? Ich habe da irgendwas verpasst...
>
> Den Webhoster gewechselt.

Oh ja. Ich bin Anfang des Jahres beim selben Hoster nur auf einen
anderen Server umgezogen. Glücklicherweise hab ich auf den alten Server
immer noch Zugriff und konnte den alten Inhalt (wenn auch nicht mehr
aktualisiert) dort liegenlassen, sodaß die Anfrage beim falschen Server
wenigstens keinen Errorcode zur Folge hatte und ich nicht komplett aus
dem Index geflogen bin.

Es hat ewig gedauert, bis die Bots die neue IP-Adresse gefressen hatten,
anscheinend haben sie einen ziemlich langlebigen IP-Cache - Googlebot
eine Woche, Slurp zwei Wochen. Der hartnäckigste war AskJeeves, der hat
6 Wochen gebraucht und ich weiß bis heute noch nicht, ob er freiwillig
gegangen ist oder ob ich ihn mithilfe des 409er-Status verscheucht habe,
den ich schließlich nur noch zurückgeliefert habe. Aber der ist eh
merkbefreit und will heute noch Seiten haben, die es seit mindestens
einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
auf den "neuen" URL ab... *grunz*

usch

Konni Scheller

unread,
Aug 1, 2002, 9:34:53 AM8/1/02
to
Huschiar Madjidi <hus...@gmx.de> wrote:

> Wie soll denn eine Suchmaschine Dich indexieren und das auch möglichst
> aktuell halten, wenn er Dich nur gelegentlich und auf Bestellung
> besuchen darf?

Wenn eine Suchmaschine *zu oft* kommt, und *heavy load* auf der Seite
produziert, dann ist es m.E. auch ok, dass zu sagen.

Nein, ich werde das nicht tun ;-)

Servus,
Konni

Konni Scheller

unread,
Aug 1, 2002, 9:34:54 AM8/1/02
to
Steffi Abel <ab...@s.netic.de> wrote:

> Das werdet ihr MACies nie verstehen. man google Toolbar.

durchgelesen.

> > was bedeutet 6/10 in etwa,
>
> befriedigend.

Jetzt die ultimative Frage, dann gebe ich Ruhe. Jede Seite kann doch
eigentlich nur zu bestimmten Themen "kompetent" sein (eigentlich ist es
ja der Autor), wie kann man dann einen "universalen" PageRank ermitteln?



> > und könnte für mich den jemand mal ermitteln ;-)?
>
> www.roterochs.de - 5/10
> www.roter-ochs.de - 0/10

Klar. Die zweite zeigt ja auf die selbe IP, wird nur
nie verlinkt.

Servus,
Konni

Boris 'pi' Piwinger

unread,
Aug 1, 2002, 9:54:53 AM8/1/02
to
Uwe Schröder wrote:

> Es hat ewig gedauert, bis die Bots die neue IP-Adresse gefressen hatten,
> anscheinend haben sie einen ziemlich langlebigen IP-Cache - Googlebot
> eine Woche, Slurp zwei Wochen.

Das hat bei mir und Google wesentlich laenger gebraucht.

> Der hartnäckigste war AskJeeves, der hat
> 6 Wochen gebraucht und ich weiß bis heute noch nicht, ob er freiwillig
> gegangen ist oder ob ich ihn mithilfe des 409er-Status verscheucht habe,
> den ich schließlich nur noch zurückgeliefert habe. Aber der ist eh
> merkbefreit und will heute noch Seiten haben, die es seit mindestens
> einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
> auf den "neuen" URL ab... *grunz*

So ist es. Und dennoch werden die alten Seiten immer noch im Ergebnis
ausgeliefert:-(

pi

Mario Mueller

unread,
Aug 1, 2002, 10:15:35 AM8/1/02
to
Konni Scheller wrote on Donnerstag, 1. August 2002 13:40:

> Danke für den Neid. Aber was *bedeutet* 5/10? Ist das gut? Was wäre
> besser?

Je höher, um so besser. 6/10 ist als besser, 7/10 noch besser, ...

> Rrrrrrrrrrrgnagnagna... Ich hab hier kein Windows...

Sei froh.

m.m

--
Englische Grammatik Online - http://www.ego4u.de

Mario Mueller

unread,
Aug 1, 2002, 10:18:49 AM8/1/02
to
Can Filip Sakrak wrote on Donnerstag, 1. August 2002 13:38:

> "Ziemlich hoch"? Ich dachte, dass das bei 7/10 anfangen wuerde. Oder
> ist dass schon "sehr hoch"?

Mit unseren 6/10 sind wir bei fast allen relevanten Suchwörtern weit
oben, wenn nicht gar an erster Stelle vertreten.

Huschiar Madjidi

unread,
Aug 1, 2002, 10:20:53 AM8/1/02
to
|* Konni Scheller in de.comm.infosystems.www.authoring.misc wrote:

> Jetzt die ultimative Frage, dann gebe ich Ruhe. Jede Seite kann doch
> eigentlich nur zu bestimmten Themen "kompetent" sein (eigentlich ist es
> ja der Autor), wie kann man dann einen "universalen" PageRank ermitteln?

Diese Frage ist hier sehr gut erklärt:
http://www.google.de/intl/de/why_use.html

|PageRank verlässt sich auf die einzigartige demokratische Natur des World
|Wide Webs, indem es die weitverzweigte Link-Struktur als einen Indikator
|für die individuelle Einschätzung der Qualität einer Seite nimmt.

usw.

--
Grüße, Huschiar Madjidi . www.netandmore.de


"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/

Mario Mueller

unread,
Aug 1, 2002, 10:21:48 AM8/1/02
to
Lars Trebing wrote on Donnerstag, 1. August 2002 12:48:

> Zum Beispiel jemand, der gerne schnell an die Informationen auf einer
> Site kommt, statt sich mit irgendwelchem albernen Klickibunti- und
> Flash-Scheiß herumzuschlagen. Gerüchten zufolge gibt es zahlreiche
> Websites, bei denen Googlebots und ähnliche richtiggehend mit
> Informationen überhäuft werden.

Mich würde mal interessieren, ob sich der Googlebot auch manchmal als
normaler Browser ausgibt um solche Seiten zu entlarven.

Konni Scheller

unread,
Aug 1, 2002, 10:35:27 AM8/1/02
to
Huschiar Madjidi <hus...@gmx.de> wrote:

> |PageRank verlässt sich auf die einzigartige demokratische Natur des World
> |Wide Webs, indem es die weitverzweigte Link-Struktur als einen Indikator
> |für die individuelle Einschätzung der Qualität einer Seite nimmt.

Also tatsächlich völlig unabhängig vom Thema.

Nun ist mir klar, wo die Probleme liegen:

- nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
sein können
- neue Seiten haben *sehr* schwer
- verlinkte Seiten können nach Änderung schlechter werden,
beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
ohne dass die Linksetzenden und damit Google das mitkriegen.

Servus,
Konni

Mario Mueller

unread,
Aug 1, 2002, 10:40:28 AM8/1/02
to
Konni Scheller wrote on Donnerstag, 1. August 2002 16:35:

> Also tatsächlich völlig unabhängig vom Thema.
>
> Nun ist mir klar, wo die Probleme liegen:
>
> - nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
> sein können
> - neue Seiten haben *sehr* schwer
> - verlinkte Seiten können nach Änderung schlechter werden,
> beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
> ohne dass die Linksetzenden und damit Google das mitkriegen.

Jo, deshalb hat auch Google manchmal haarstäubende Ergebnisse.

Huschiar Madjidi

unread,
Aug 1, 2002, 10:55:33 AM8/1/02
to
|* Konni Scheller in de.comm.infosystems.www.authoring.misc wrote:

> - nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
> sein können

Bedenke bitte, daß die 'gute' Seiten sehr schnell und gerne verlinkt
und zitiert werden. Aber wie definiert man 'gut'? Viel mehr denke ich,
daß eine Seite für die Besucher wichtig und unverzichtbar sein muß.
Letztendlich spielen hier nur die Inhalte eine Rolle, diese können
Informationen sein (spiegel.de 8/10), oder auch wichtige Tools und
Updates (microsoft 8/10).

> - neue Seiten haben *sehr* schwer

Nur für kurze Zeit am Anfang, sobald man die 'verborgenen Schätze' und
somit die Werte der Seite entdeckt hat, werden Sie eben gerne verlinkt
und so wandern Sie ganz nach oben.

> - verlinkte Seiten können nach Änderung schlechter werden,
> beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
> ohne dass die Linksetzenden und damit Google das mitkriegen.

Wenn Sie inhaltlich schlechter werden und damit weniger wichtig, dann
auf jeden Fall.

--
Grüße, Huschiar Madjidi . www.netandmore.de
"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/

>Konfuzius sprach: "Es gibt nur wenig Fälle, in denen Menschen einen
>Fehler damit begangen haben, sich in einer Sache selbst zu beschränken."

Can Filip Sakrak

unread,
Aug 1, 2002, 11:56:15 AM8/1/02
to
Bjoern Hoehrmann schrieb:

> Selbst http://bjoern.hoehrmann.de/ hat 6/10...

Ich habe das Gefuehl, dass "outgoing links" staerker als Linkverweise
auf die entsprechende Seite gewertet werden. [1]

Viele Gruesse
Can Filip Sakrak

________
[1] http://de.webmasterplan.com/cgi-local/router.cgi?l=de&p=wmpde&s=mon_linkpop

--

Wizard fuer SPAM-Filter: http://spamabwehr.sakrak.net/

F.A.Q. zu Webauthoring : http://www.dciwam.de/faq/

F.A.Q. zum Posten : http://www.learn.to/quote/

Oeffentl. Usenetarchiv : http://groups.google.com/

Bjoern Hoehrmann

unread,
Aug 1, 2002, 11:45:52 AM8/1/02
to
* Huschiar Madjidi wrote in de.comm.infosystems.www.authoring.misc:

>|* Can Filip Sakrak in de.comm.infosystems.www.authoring.misc wrote:
>
>> > <neid on>Ziemlich hoch: Im Moment liegst Du bei 5/10.<neid off>
>>
>> "Ziemlich hoch"? Ich dachte, dass das bei 7/10 anfangen wuerde. Oder ist
>> dass schon "sehr hoch"?
>
>Naja, man könnte damit zufrieden sein, für mich ist 5/10 für eine
>private Seite ziemlich hoch, aber für eine Seite wie www.gmx.de (6/10)
>wohl zu niedrig.

Selbst http://bjoern.hoehrmann.de/ hat 6/10...

Steffi Abel

unread,
Aug 1, 2002, 11:52:20 AM8/1/02
to
"Konni Scheller" <ko...@roterochs.de> schrieb:

> Jetzt die ultimative Frage, dann gebe ich Ruhe. Jede Seite kann doch
> eigentlich nur zu bestimmten Themen "kompetent" sein (eigentlich ist
> es ja der Autor), wie kann man dann einen "universalen" PageRank
> ermitteln?

Der Pagerank dient ja nicht dazu, die Relevanz einer Seite zu
beurteilen. Der Pagerank wird verwendet, um die gefundenen relevanten
Seiten zu sortieren.

Bei der Suche nach "pfngz" taucht yahoo.com gar nicht auf, obwohl
yahoo.com einen Pagerank von 10/10 hat. Bei der Suche nach "finance"
dagegen landet finance.yahoo.com (9/10) auf Platz 1 vor cnn.com (9/10)
und dem japanischen Ministry of Finance (7/10).

Gruß Steffi

Konni Scheller

unread,
Aug 1, 2002, 12:22:21 PM8/1/02
to
Steffi Abel <ab...@s.netic.de> wrote:

> Der Pagerank dient ja nicht dazu, die Relevanz einer Seite zu
> beurteilen. Der Pagerank wird verwendet, um die gefundenen relevanten
> Seiten zu sortieren.

Ahso. Danke für die Erläuterung.

Ich vermute mal, dass ob der Dichte meines Genres (es gibt *wahnsinnig*
viele Gasthäuser im Web) die Links sich wohl etwas sehr verteilen.

Servus,
Konni

Lupus Goebel

unread,
Aug 1, 2002, 1:17:43 PM8/1/02
to
Hallöschen,

On 8/1/2002 3:03 PM Boris 'pi' Piwinger schrieb:
[..]

>
> Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
> Monat. Totaler Einbruch der Abrufe.

Tschuldigung wenn ich Dauschen mal dazwischen tröte.
Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?
Dachte das geht über die URL. Auch ich hatte den Provider gewechselt und
mich über den geringen Besucherstrom gewundert. Dabei sind die Seiten
mit den gleichen Suchbegriffen nach wie vor zu finden.

*verwirrtguggt* Wie hängt das denn zusammen, oder habe ich euch hier gar
gar falsch verstanden.

[1]
Wusste nicht mal das sich die IP ändert bei einem Providerumzug. Aber
irgendwie logisch wenn ich nun drüber nachdenke. Schließlich ist das Web
nun ja auch physikalisch auf einem anderem System. Nicht mehr in der
Karlstraße in Köln, sondern in der Meiergasse in Frankfurt, sozu sagen
neue Adresse.

--
MfG - Lupus Göbel
Der Sumpf und Morasthobbybastler und Anfänger mit
Wissensdurst (http://www.lupusdw.de)

Can Filip Sakrak

unread,
Aug 1, 2002, 1:19:37 PM8/1/02
to
Mario Mueller schrieb:

> Mich würde mal interessieren, ob sich der Googlebot auch manchmal als
> normaler Browser ausgibt um solche Seiten zu entlarven.

Ich wuerde es nicht ausschliessen. :-)

Viele Gruesse
Can Filip Sakrak

--

Boris 'pi' Piwinger

unread,
Aug 1, 2002, 1:25:35 PM8/1/02
to
Lupus Goebel wrote:

>> Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
>> Monat. Totaler Einbruch der Abrufe.
>
> Tschuldigung wenn ich Dauschen mal dazwischen tröte.
> Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?

Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
verwenden, der wesentlich laenger speichert als er soll.

pi

Lupus Goebel

unread,
Aug 1, 2002, 1:33:22 PM8/1/02
to
Hallöschen,

On 8/1/2002 7:25 PM Boris 'pi' Piwinger schrieb:
[...]

>> Tschuldigung wenn ich Dauschen mal dazwischen tröte.
>> Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?
>
> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
> verwenden, der wesentlich laenger speichert als er soll.

Aha, heißt: Die speichern nicht nur die URL sondern die IP-Adresse einer
Seite. Geben aber die gespeicherte URL wieder als Suchergebniss aus.
Kann man das so verstehen?
Aber was hat das dann mit dem Ergebnis der Suchmaschine zu tun? Das
bleibt sich doch gleich?
Beim Klick auf dir URL wird man doch an die richtige Stelle verwiesen.


--
MfG - Lupus Göbel

Mh, ich glaube ich werde nicht weiter versuchen es zu verstehen. Werde
mich lieber weiter um meine Tabellenlöschungen kümmern.

Boris 'pi' Piwinger

unread,
Aug 1, 2002, 1:35:46 PM8/1/02
to
Lupus Goebel wrote:

>>> Tschuldigung wenn ich Dauschen mal dazwischen tröte.
>>> Eine IP-Aenderung hat Auswirkungen auf die Suchmaschinen [1]?
>>
>> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
>> verwenden, der wesentlich laenger speichert als er soll.
>
> Aha, heißt: Die speichern nicht nur die URL sondern die IP-Adresse einer
> Seite. Geben aber die gespeicherte URL wieder als Suchergebniss aus.
> Kann man das so verstehen?

Nein. Die betreiben natuerlich DNS-Server, wie jeder andere auch. Nur,
dass deren DNS-Server "etwas" mehr Stress hat als andere;-) Daher wird
er wohl so manipuliert, dass er ueber die Masse hinaus die IP-Adresse
vormerkt. Wird dann eine Seite ueberprueft, wird der DNS-Server
gefragt, der aber die Aenderung nicht mitbekommt. Also wird der
flasche Rechner angesprochen.

Interessanterweise ist mein letzter Umzug wesentlich besser verlaufen,
da gab es AFAICS keine Probleme.

pi

Steffi Abel

unread,
Aug 1, 2002, 1:41:12 PM8/1/02
to
"Konni Scheller" <ko...@roterochs.de> schrieb:

> Ich vermute mal, dass ob der Dichte meines Genres (es gibt
> *wahnsinnig* viele Gasthäuser im Web) die Links sich wohl
> etwas sehr verteilen.

Ich hab so das Gefühl, dir passt das nicht, dass du "nur" 5/10 hast?
Bekommst den Hals wohl nicht voll genug?

5/10 ist für eine Seite wie die deine ein sehr respektables Ergebnis.
Vergleiche dich mit den besten Restaurants Deutschlands:

traube-tonbach.de 0/10
residenz-heinz-winkler.de 4/10
im-schiffchen.com 2/10
schlosshotel-lerbach.com 4/10

Was willst mehr?

Gruß Steffi

Lupus Goebel

unread,
Aug 1, 2002, 2:17:19 PM8/1/02
to
Hallöschen,

On 8/1/2002 7:35 PM Boris 'pi' Piwinger schrieb:
[..]

>>
>> Aha, heißt: Die speichern nicht nur die URL sondern die IP-Adresse
>> einer Seite. Geben aber die gespeicherte URL wieder als
>> Suchergebniss aus. Kann man das so verstehen?
>
> Nein. Die betreiben natuerlich DNS-Server, wie jeder andere auch.
> Nur, dass deren DNS-Server "etwas" mehr Stress hat als andere;-)

Gibt es da nicht was von Ratziofarm? *g*

> Daher wird er wohl so manipuliert, dass er ueber die Masse hinaus die
> IP-Adresse vormerkt. Wird dann eine Seite ueberprueft, wird der
> DNS-Server gefragt, der aber die Aenderung nicht mitbekommt. Also
> wird der flasche Rechner angesprochen.

Nun habe ich es verstanden.


>
> Interessanterweise ist mein letzter Umzug wesentlich besser
> verlaufen, da gab es AFAICS keine Probleme.

Sach doch, spielt viel zu viel Zufall mit als das man dabei 100% Regeln
aufstellen kann.

Recht herzlichen Dank.


--
MfG - Lupus Göbel

Konni Scheller

unread,
Aug 1, 2002, 2:42:04 PM8/1/02
to
Steffi Abel <ab...@s.netic.de> wrote:

> Ich hab so das Gefühl, dir passt das nicht, dass du "nur" 5/10 hast?
> Bekommst den Hals wohl nicht voll genug?

So ist es :-) Du vermutest richtig.

Ich merk das schon bei meiner Nelli: Frauen haben ein gutes Gespür für
Sachen, die hinter dem Gesagten stehen :))

> 5/10 ist für eine Seite wie die deine ein sehr respektables Ergebnis.
> Vergleiche dich mit den besten Restaurants Deutschlands:
>
> traube-tonbach.de 0/10
> residenz-heinz-winkler.de 4/10
> im-schiffchen.com 2/10
> schlosshotel-lerbach.com 4/10
>
> Was willst mehr?

Das willst Du nicht wirklich wissen. Aber ich glaube, ich werde es
schaffen.

Servus,
Konni

Philipp Lenssen

unread,
Aug 1, 2002, 3:17:00 PM8/1/02
to
"Steffi Abel" <ab...@s.netic.de> wrote in message
news:aibli0$139cv1$1...@ID-143025.news.dfncis.de...

> "Konni Scheller" <ko...@roterochs.de> schrieb:
>
> > Jetzt die ultimative Frage, dann gebe ich Ruhe. Jede Seite kann doch
> > eigentlich nur zu bestimmten Themen "kompetent" sein (eigentlich ist
> > es ja der Autor), wie kann man dann einen "universalen" PageRank
> > ermitteln?
>
> Der Pagerank dient ja nicht dazu, die Relevanz einer Seite zu
> beurteilen. Der Pagerank wird verwendet, um die gefundenen relevanten
> Seiten zu sortieren.
>..

Genauer gesagt ist der PageRank ein Sortierkriterium unter vielen, und
nicht mal das wichtigste. Wo ein Stichwort genau vorkommt (im Titel, in
Überschriften, im Dateiname, im Domainnamen) und wie oft es vorkommt ist
z.B. entscheidender. So können dann auch relativ "unbedeutende" (zumindest
wenig verlinkte) Seiten zu einem Erst-Ranking auf der Trefferliste führen.
Beispielsweise wenn man als Sucher verschiedene Stichworte angibt, und
sich aus denen eine Phrase bilden lässt, die sich auf einer indexierten
Seite findet, so ist das bedeutender, als wenn eine andere Seite einen
hohen PageRank und ansonsten bloss die Stichworte enthält.

Somit haben also auch Seiten der Kategorie "klein, neu, unbekannt, aber
relevant" eine Chance, solange sie nur einmal verlinkt sind und Google
drüber gegangen ist (ein paar Monate muß man natürlich schon warten in der
Regel).

Und wer seinen PageRank erhöhen will... http://dmoz.org ist ein guter
Anfang. Was hier gelistet wird taucht nach ca. einem halben Jahr auf 100en
von Seiten auf (d.H. nachdem ein Redakteur es akzeptiert hat und die
ganzen Suchkataloge ihre Daten an Hand des Open Directory aktualisiert
haben).

Ansonsten ist der PageRank wohl die Sache, bei der man sich am wenigstens
Gedanken machen muß, weil man auch am wenigsten Einfluß hat.
(Titel-Optimierungen usw. kann man ja einfach selbst vornehmen.)
Trotzdem für mehr Details interessant:

PageRank Explained
http://www.goodlookingcooking.co.uk/PageRank.pdf


Lars Kasper

unread,
Aug 1, 2002, 3:21:37 PM8/1/02
to
ko...@roterochs.de (Konni Scheller) schrieb:

> Google war gestern das letzte Mal bei mir.

<link rel="help"/>

Was heißt "das letzte Mal"? Hast Du ihn ausgesperrt? Oder willst Du
damit sagen, daß er einfach nur häufig vorbeikommt?


Lars Kasper (über eine dciw.search nachdenkend)

Konni Scheller

unread,
Aug 1, 2002, 3:33:36 PM8/1/02
to
Lars Kasper <ma...@LarsKasper.de> wrote:

> Was heißt "das letzte Mal"? Hast Du ihn ausgesperrt? Oder willst Du
> damit sagen, daß er einfach nur häufig vorbeikommt?

Ja, so ist es.

Gefällt mir.

Seltsamerweise spidert er Seiten, die dann aber mit wochenlanger
Verzögerung erst gefunden werden.


> Lars Kasper (über eine dciw.search nachdenkend)

Finde ich nicht gut. Es ist dermaßen verwoben mit dem, was Du auf die
Seite schreibst, dass _eine_ Gruppe für beides ausreicht und eher das
Gruppentopic geändert werden sollte, damit es Suchmaschinenfragen mit
einschließt.

Servus,
Konni

Jens Müller

unread,
Aug 1, 2002, 3:27:42 PM8/1/02
to
Huschiar Madjidi <hus...@gmx.de> writes:

> |How often will Googlebot access my web pages?
>
> |For most sites, Googlebot should not access your site more than once
> |every few seconds on average.

Und wenn's mehr wird, darf man sich beschweren ...
--
Why is it that an author can write a book faster than an agent can read it?
[G. Miki Hayden]

Jens Müller

unread,
Aug 1, 2002, 3:30:47 PM8/1/02
to
Uwe Schröder <usch...@gmx.de> writes:

> ber der ist eh
> merkbefreit und will heute noch Seiten haben, die es seit mindestens
> einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
> auf den "neuen" URL ab... *grunz*

Och, Google hat nicht mehr existierende Seiten teilweise auch recht
lange im Cache ...
--
"So habe ich das vor Jahren von einem Mitzivi mit italienischer Mama
gelernt: Kochzeit _ mindestens_ vier Stunden.
Isse nix Rezept Mama Miraculi, aufbass!" /in de.alt.fan.aldi
Hartmut 'Hardy' Schiszler in <a9sp6i.3...@ID-82801.user.dfncis.de>

Jens Müller

unread,
Aug 1, 2002, 3:31:37 PM8/1/02
to
Mario Mueller <nos...@ego4u.de> writes:

> Lars Trebing wrote on Donnerstag, 1. August 2002 12:48:
>
>> Zum Beispiel jemand, der gerne schnell an die Informationen auf einer
>> Site kommt, statt sich mit irgendwelchem albernen Klickibunti- und
>> Flash-Scheiß herumzuschlagen. Gerüchten zufolge gibt es zahlreiche
>> Websites, bei denen Googlebots und ähnliche richtiggehend mit
>> Informationen überhäuft werden.
>
> Mich würde mal interessieren, ob sich der Googlebot auch manchmal als
> normaler Browser ausgibt um solche Seiten zu entlarven.

In de.admin.net-abuse.misc gab es mal einen Fall, wo jemand
massenweise Doorway-Pages zu einem Amazon-Partneraccount gelegt
hat. Mit Referer (=das sind die Besucher, die die Seite über
Suchmaschine gefunden haben) kam man zu Amazon (mit Partner-ID,
natürlich), ohne kam wohl ne Menge Stoff für den Google-Bot. Das hatte
da jemand getestet, an User-Agent-Sensitivität kann ich mich nicht
erinnern, vielleicht hat er das auch bloß nicht getestet.
--
"Ganz einfach: Ich habe selten viel mehr als 50 EUR in Bar bei mir." - "???
Wieso? Bist du noch minderjährig und bekommst so wenig Taschengeld? Oder hast
du Angst, die Islamisten könnten dich ausrauben?" Andreas Mauerer und Konrad
Wilhelm in <3saubukbi99vu94nh...@4ax.com> in de.alt.fan.aldi

Uwe Schröder

unread,
Aug 1, 2002, 4:18:03 PM8/1/02
to
On Thu, 01 Aug 2002 21:30:47 +0200, Jens Müller wrote:

> > merkbefreit und will heute noch Seiten haben, die es seit mindestens
> > einem Jahr in der Form nicht mehr gibt und holt sich jedesmal seinen 301
> > auf den "neuen" URL ab... *grunz*
>
> Och, Google hat nicht mehr existierende Seiten teilweise auch recht
> lange im Cache ...

Das ist ein Unterschied, ob sie die Seiten noch als Archiv vorrätig
haben oder ob ein Spider immer wieder danach fragt, obwohl er jedesmal
gesagt bekommt, daß es die Seite nicht mehr gibt.

Googlebot fragt AFAIK nach einem 301 kein zweites Mal nach der Seite, es
sei denn, irgendwo in der weiten Welt gibt es noch einen falsch
gesetzten Link, dem er gefolgt ist.

usch

--
Any feature is a bug unless it can be turned off. (Heuer's Law, 1990)

Rainer Kersten

unread,
Aug 1, 2002, 2:12:00 PM8/1/02
to
Huschiar Madjidi(Huschiar Madjidi) meinte am 1.08.2002:

[pagerank Anzeige google taskbar]
> Wie objektiv solche Wertungen sind kann ich allerdings nicht
> beurteilen. IMHO ist es nur ein Barometer, selbst ein Barometer kann
> kaputt sein und die Leute (ent)täuschen...

http://pr.efactory.de/d-pagerank-implementierung.shtml

Rainer Kersten

unread,
Aug 1, 2002, 2:28:58 PM8/1/02
to
Konni Scheller(Konni Scheller) meinte am 1.08.2002:

> - nicht verlinkte Seiten bekommen schlechte Bewertung obwohl sie "gut"
> sein können

Ja. Es ist allerdings kaum denkbar, das wirklich gute Seiten
in akzeptablen Zeiträumen nicht auch eingehende Links
bekommen, daher...

> - neue Seiten haben *sehr* schwer

...gilt dies nicht lange. (Du erinnerst Dich an unsere
Fachsimpelei...?)

> - verlinkte Seiten können nach Änderung schlechter werden,
> beispielsweise wenn eine Marketingagentur sie in die Finger kriegt,
> ohne dass die Linksetzenden und damit Google das mitkriegen.

Jein. Wenn (unabhängig von der Qualität der Inhaltes) Seiten
durch Pixelschubser unzugänglich gemacht werden, kann Google
da auch nix mehr indizieren. Dann hat Google nur noch die
eingehenden Links und deren Texte. Mehr nicht.
<glaskugel>Die Seiten werden runtergestuft oder verschwinden
im Extremfall völlig aus der Datenbank.</glaskugel>

Google kriegt das schon mit, wenn er den Links nicht mehr
sinnvoll folgen kann. Wenn trotzdem noch 2000 Leute darauf
linken, dann wird Google voraussichtlich mindestens die URL
in der Datenbank halten. Ich kenne da einige Firmen, bei
denen die URL dem Firmennamen entspricht. Fütterst Du Google
damit, kommt die (unzugängliche) Startseite auf Platz eins.
Fügst Du ein relevantes Suchwort (zB ein Produkt
der Firma) hinzu, sind sie weg.

Gruss Rainer

Rainer Kersten

unread,
Aug 1, 2002, 2:15:52 PM8/1/02
to
Boris 'pi' Piwinger(Boris 'pi' Piwinger) meinte am 1.08.2002:
> Michael Jendryschik wrote:
> >> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
> >> besucht wird? Ich habe da irgendwas verpasst...
> > Den Webhoster gewechselt.
> > Relativ gut besucht wird die Seite nach wie vor. Google hat mir
> > etwa 60 Besucher pro Tag gebracht, die sind jetzt natürlich weg.

> Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
> Monat. Totaler Einbruch der Abrufe.

Ich verstehe das nicht. Nie nicht. So einen Fall hatte ich
noch nie. Und ich habe etliche Umzüge hinter mir bzw.
betreut.

Den umgekehrten Fall hatte ich allerdings schon mehrfach:
Nach einem Umzug von $massenbillighoster zu
$richtigem_hoster war die Position bei Google plötzlich
deutlich besser.

IMO kann das nur irjendswie mit den beteiligten
Hostern zusammenhängen. Aber wie...?

Gruss Rainer

Andreas Ferber

unread,
Aug 1, 2002, 6:19:31 PM8/1/02
to
* Jens Müller <je...@unfaehig.de> schrieb:

>
> In de.admin.net-abuse.misc gab es mal einen Fall, wo jemand
> massenweise Doorway-Pages zu einem Amazon-Partneraccount gelegt
> hat. Mit Referer (=das sind die Besucher, die die Seite über
> Suchmaschine gefunden haben) kam man zu Amazon (mit Partner-ID,
> natürlich), ohne kam wohl ne Menge Stoff für den Google-Bot. Das hatte
> da jemand getestet, an User-Agent-Sensitivität kann ich mich nicht
> erinnern, vielleicht hat er das auch bloß nicht getestet.

Besagter Tester war meinereiner, und bei fehlendem Referer war es
User-Agent-sensitiv ("Mozilla" im User-Agent führte zu einem gefaketen
404, vermutlich um zu verhindern, daß jemand bei Google das Spamming
bemerkt, wenn er nach einem Hinweis einfach die URL in seinen Browser
pastet).

Details siehe <slrna9v3pl...@falsche.message-ids.sind-doof.de>

Andreas
--
Andreas Ferber - dev/consulting GmbH - Bielefeld, FRG
---------------------------------------------------------
+49 521 1365800 - a...@devcon.net - www.devcon.net

Rainer Kersten

unread,
Aug 1, 2002, 3:31:18 PM8/1/02
to
Steffi Abel(Steffi Abel) meinte am 1.08.2002:

> Der Pagerank dient ja nicht dazu, die Relevanz einer Seite zu
> beurteilen. Der Pagerank wird verwendet, um die gefundenen relevanten
> Seiten zu sortieren.

Richtig. Anderes Beispiel: "google.de Kontakt". Die erste
Google-eigene Seite erscheint erst auf Platz 6.

Hihihi.
Rainer

Rainer Kersten

unread,
Aug 1, 2002, 3:26:56 PM8/1/02
to
Bjoern Hoehrmann(Bjoern Hoehrmann) meinte am 1.08.2002:

> Selbst http://bjoern.hoehrmann.de/ hat 6/10...

Kein Wunder. ;-)
Kipp doch mal "link:bjoern.hoehrmann.de" bei Google rein.
Und Du hast sehr viele gute ausgehende Links, u.a. auf
bjoernsworld.de. ;-)

Gruss Rainer

Rainer Kersten

unread,
Aug 1, 2002, 3:32:48 PM8/1/02
to
de.comm.infosystems.www.authoring.misc meinte am 1.08.2002:

> Ich habe das Gefuehl, dass "outgoing links" staerker als Linkverweise
> auf die entsprechende Seite gewertet werden. [1]

Glaubichnich.

Can Filip Sakrak

unread,
Aug 1, 2002, 6:56:45 PM8/1/02
to
Rainer Kersten schrieb:

>> Ich habe das Gefuehl, dass "outgoing links" staerker als Linkverweise
>> auf die entsprechende Seite gewertet werden. [1]

> Glaubichnich.

Das habe ich jedenfalls geglaubt, als ich feststellen durfte, dass
[1] hoeher als [2] gewertet wird, obwohl auf [2] oefters verwiesen wird.
Natuerlich spielen auch incoming links und Inhaltsmenge eine Rolle.
[3] hat 6/10 (alle Inhalte nur im Mitgliederbereich und somit vor Robots
geschuetzt) und [4] 10/10...

Daraus ergibt sich wahrscheinlich folgende Reihenfolge:

- outgoing links
- incoming links
- content / interne Verlinkungsstruktur

Viele Gruesse
Can Filip Sakrak

________
[1] http://bjoern.hoehrmann.de/
[2] http://spamabwehr.sakrak.net/
[3] http://www.gmx.de/
[4] http://www.w3c.org/

Michael Jendryschik

unread,
Aug 1, 2002, 7:13:39 PM8/1/02
to
/* Lars Kasper <ma...@LarsKasper.de> schrieb: */

>> Google war gestern das letzte Mal bei mir.
>
><link rel="help"/>
>
>Was heißt "das letzte Mal"? Hast Du ihn ausgesperrt? Oder willst Du
>damit sagen, daß er einfach nur häufig vorbeikommt?
>
>
>Lars Kasper (über eine dciw.search nachdenkend)

Wie ich bereits vor einiger Zeit in
<3d360e78...@news.jendryschik.de> vorschlug. Wirklich viele von
euch haben sich dazu jedoch nicht geäußert, vor allem auch, da Björn mit
seinem Vorschlag zur kompletten Reorganisation abgelenkt (aber seitdem
nichts mehr dafür unternommen) hat. Vielleicht frage ich in einigen
Wochen in dciwam und dciwpm noch einmal nach, ob Interesse an einer
solchen Gruppe besteht.

MI

--
: Michael Jendryschik : mic...@jendryschik.de : http://jendryschik.de/ :
: Einführung in (X)HTML, CSS und Webdesign http://jendryschik.de/wsdev/ :
: Monatlich das Beste aus de.alt.netdigest http://best-of-netdigest.de/ :

Marco Schmidt

unread,
Aug 1, 2002, 7:27:50 PM8/1/02
to
Can Filip Sakrak wrote:

>Das habe ich jedenfalls geglaubt, als ich feststellen durfte, dass
>[1] hoeher als [2] gewertet wird, obwohl auf [2] oefters verwiesen wird.

Ein wesentlicher Punkt ist eben auch der PR der eingehenden Links
(weniger aber qualitativ hochwertigere Links bringen eventuell mehr)
sowie der Text, mit dem auf etwas verwiesen wird.

Suchst Du nach "KEYWORD", und es wird per <a
href="http://deinesite">KEYWORD</a> von irgendwo (mit möglichst hohem
PR) auf Deine Seite verwiesen, hilft das bei der speziellen Suche nach
KEYWORD sehr, wenn KEYWORD sonst nicht (oder kaum) auf der Seite
auftaucht.

[...]

>Daraus ergibt sich wahrscheinlich folgende Reihenfolge:
>
> - outgoing links
> - incoming links
> - content / interne Verlinkungsstruktur

Ich kann nicht ganz folgen, wieso die Reihenfolge? Und inwiefern
fließt der Content bei der Berechnung des PR ein?

Gruß,
Marco

Huschiar Madjidi

unread,
Aug 1, 2002, 7:55:40 PM8/1/02
to
|* Bjoern Hoehrmann in de.comm.infosystems.www.authoring.misc wrote:

>>Naja, man könnte damit zufrieden sein, für mich ist 5/10 für eine
>>private Seite ziemlich hoch, aber für eine Seite wie www.gmx.de (6/10)
>>wohl zu niedrig.


>
>Selbst http://bjoern.hoehrmann.de/ hat 6/10...

Deine Seite bezeichne ich auch nicht unbedingt als eine reine
Privatseite, dort sind nützliche Informationen plaziert und das wird
belohnt.

Ich glaube, daß Alan mit 7/10 bei 'uns' an der höchste Stelle steht...

--
Grüße, Huschiar Madjidi . http://www.netandmore.de
>You may visit the ghetto-museum. guides tours available. open daily.
>our special advice: after the visit go and stroll through the older
>parts of the village in order to restore your calm.

Marco Stielow

unread,
Aug 1, 2002, 12:42:58 PM8/1/02
to
Michael Jendryschik wrote:
>> Was hast Du denn nochmal gemacht, damit Deine Website nicht mehr so gut
>> besucht wird? Ich habe da irgendwas verpasst...
>
> Den Webhoster gewechselt.
>
Hä? Wieso wirkt sich das denn auf die Besuche aus?

--
mfG.
Marco Stielow

Huschiar Madjidi

unread,
Aug 2, 2002, 2:31:54 AM8/2/02
to
|* Rainer Kersten in de.comm.infosystems.www.authoring.misc wrote:

> Huschiar Madjidi(Huschiar Madjidi) meinte am 1.08.2002:

^^^^^^^^^^^^^^^^

Warum erscheint hier mein Name doppelt? Vielleicht falsche
Reader-Einsetllungen?

> [pagerank Anzeige google taskbar]
> > Wie objektiv solche Wertungen sind kann ich allerdings nicht
> > beurteilen. IMHO ist es nur ein Barometer, selbst ein Barometer kann
> > kaputt sein und die Leute (ent)täuschen...
>
> http://pr.efactory.de/d-pagerank-implementierung.shtml

Interessanter Artikel, daraus kannst Du zwar nicht erkennen, wie
objektiv solche Wertungen sind, aber die Funktionsweise ist gut
erklärt.

--
Grüße, Huschiar Madjidi . http://www.netandmore.de

"Wie zitiere ich im Usenet?" . www.afaik.de/usenet/faq/zitieren/
>the requested URL was not found on this server the link you followed is either
>outdated, inaccurate, or the server has been instructed not to let you have it

Can Filip Sakrak

unread,
Aug 2, 2002, 3:42:08 AM8/2/02
to
Marco Schmidt schrieb:

> Suchst Du nach "KEYWORD", und es wird per <a
> href="http://deinesite">KEYWORD</a> von irgendwo (mit möglichst hohem
> PR) auf Deine Seite verwiesen, hilft das bei der speziellen Suche nach
> KEYWORD sehr, wenn KEYWORD sonst nicht (oder kaum) auf der Seite
> auftaucht.

Mit dem main keyword "spamabwehr" ist meine Website ja auch auf Platz 1.

> Ich kann nicht ganz folgen, wieso die Reihenfolge? Und inwiefern
> fließt der Content bei der Berechnung des PR ein?

Ich denke, dass es auf die qualitative Menge ankommt.

Viele Gruesse
Can Filip Sakrak

--

Konni Scheller

unread,
Aug 2, 2002, 4:10:15 AM8/2/02
to
Rainer Kersten <r.ke...@BILKINFO.de> wrote:

> http://pr.efactory.de/d-pagerank-implementierung.shtml

Ah. Danke für den Link.

Servus,
Konni

Wolfgang Ewert

unread,
Aug 2, 2002, 4:48:15 AM8/2/02
to
Hallo Huschiar, Du teiltest am mit:

> |* Uwe Schröder in de.comm.infosystems.www.authoring.misc wrote:
>
> > > Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
> >
> > Nö, aber bei einem HTTP-Zugriff "User-Agent: Googlebot/2.1" senden kann
> > jedes ScriptKid.
>
> Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?

Schau mal in die Diskussion hier "Suchmaschinenfreundlich?" vom Februar,
Thread ab MID:<a58f8s$kki$1...@rks1.urz.tu-dresden.de>.

Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten heraus, die
Spamdexing betreiben und (bis heute) noch nicht von Google aus der DB
rausgeworfen worden sind :-(

Bsp.:
http://www.google.de/search?q=Meinersdorf+Kirchen+Tannroda+Groitzsch

Und mit dem ersten Hit (jeder andere funktioniert sicher auch):
lynx als UA:googlebot http://www5.private- flirt- erotikkontakte.de/
ueberblick8_stat.html

"... Gays Callgirls Callboys Meinersdorf Kirchen Tannroda Groitzsch Schiphorst |
Kontaktanzeigen Swingerclubs Sex Bordelle..." identisch mit dem Google-Ergebnis.

ohne UA: googlebot das übliche für Bots Unlesbare:
<html><head><title></title></head>
<frameset ...>
<frame frameborder=0 ... SRC="http://www.kontaktanzeigenmarkt24. de/" ...>
<frame frameborder=0 ... marginwidth=0 marginheight=0 Scrolling=no noresize>
</frameset></html>

noch Fragen?

Wolfgang
mit seinen Verweisen zu Beobachtungen der letzten Sonnenfinsternis in
Mitteleuropa immer noch hervorrgand placi^H^Hzie^H^H^Htziert.

Boris 'pi' Piwinger

unread,
Aug 2, 2002, 6:01:19 AM8/2/02
to
Rainer Kersten wrote:

>> Eine IP-Aenderung hat bei mir dafuer gereicht. Schadensdauer rund ein
>> Monat. Totaler Einbruch der Abrufe.
>
> Ich verstehe das nicht. Nie nicht. So einen Fall hatte ich
> noch nie. Und ich habe etliche Umzüge hinter mir bzw.
> betreut.

Tja, ich hatte zwei Umzuege. Der erste war halt wirklich uebel. Der
zweite unbemerkt. Vielleicht haben sie was angepasst.

> Den umgekehrten Fall hatte ich allerdings schon mehrfach:
> Nach einem Umzug von $massenbillighoster zu
> $richtigem_hoster war die Position bei Google plötzlich
> deutlich besser.
>
> IMO kann das nur irjendswie mit den beteiligten
> Hostern zusammenhängen. Aber wie...?

Rein spekulativ: Sie koennten die Spider bzgl. der Anzahl der Aufrufe
in bestimmten Netzen (Class Irgendwas) pro Zeiteinheit beschraenkt haben.

pi

Boris 'pi' Piwinger

unread,
Aug 2, 2002, 6:05:41 AM8/2/02
to
Anette Stegmann wrote:

> Ist Dir bewußt, daß dies im Gegensatz zu vielen Quellen
> steht, denenzufolge, outgoing links den page rank vermindern?

Das scheint mir unzulaessig verkuerzt.

> Demnach sollte ich klarstellen, ob ich Dich richtig
> verstanden habe: Du meinst: Wenn eine Seite A einen Link auf
> eine andere Seite B enthält, kann das den Rank von A erhöhen?

Waere jedenfalls sinnvoll, da die Technologie zwei Arten von Seiten
identifizieren sollte: Authorities und Hubs.

> Hat das irgendwie mit dem Rank von B zu tun?

Das waere dann zwingend.

pi

Lars Kasper

unread,
Aug 2, 2002, 6:28:28 AM8/2/02
to
Michael Jendryschik <mic...@jendryschik.de> schrieb:

[de.comm.infosystems.www.search]


> Vielleicht frage ich in einigen Wochen in dciwam und dciwpm
> noch einmal nach, ob Interesse an einer solchen Gruppe besteht.

Ich bitte darum.

Du könntest ja schon einmal mit einer unverbindlichen
Traffic-Auszählung beginnen ...


Lars Kasper
--
<http://larskasper.de/> persönliche Webseite
<http://dciwam.de/faq/> Webauthoring-FAQ: HTML, CSS, usw.

Can Filip Sakrak

unread,
Aug 2, 2002, 7:31:25 AM8/2/02
to
Boris 'pi' Piwinger schrieb:

> Anette Stegmann wrote:

>> Demnach sollte ich klarstellen, ob ich Dich richtig
>> verstanden habe: Du meinst: Wenn eine Seite A einen Link auf
>> eine andere Seite B enthält, kann das den Rank von A erhöhen?

> Waere jedenfalls sinnvoll, da die Technologie zwei Arten von Seiten
> identifizieren sollte: Authorities und Hubs.

Ihr habt mich beide richtig verstanden.

>> Hat das irgendwie mit dem Rank von B zu tun?

> Das waere dann zwingend.

Korrekt.

Viele Gruesse
Can Filip Sakrak

--

Huschiar Madjidi

unread,
Aug 2, 2002, 7:42:35 AM8/2/02
to
|* Wolfgang Ewert in de.comm.infosystems.www.authoring.misc wrote:

> > Klar, aber wer hätte denn Interesse an solche Manipulationen und wozu?
>
> Schau mal in die Diskussion hier "Suchmaschinenfreundlich?" vom Februar,
> Thread ab MID:<a58f8s$kki$1...@rks1.urz.tu-dresden.de>.

Erleuchtend...:-)

> Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten heraus, die
> Spamdexing betreiben und (bis heute) noch nicht von Google aus der DB
> rausgeworfen worden sind :-(

Traurig zu wissen, danke für den Hinweis.

--
Grüße, Huschiar Madjidi . http://www.netandmore.de

>wir lassen Sie nicht allein. mit Ihnen gemeinsam führen wir in Ihrem haus
>die systemtests durch. wenn Sie es wünschen. optimieren und integrieren
>wir Sie in das gesamtsystem. (teltakt: standard for telephone numbers)

Rainer Kersten

unread,
Aug 2, 2002, 6:32:12 AM8/2/02
to
de.comm.infosystems.www.authoring.misc meinte am 1.08.2002:
> Mario Mueller schrieb:

> > Mich würde mal interessieren, ob sich der Googlebot auch manchmal als
> > normaler Browser ausgibt um solche Seiten zu entlarven.
> Ich wuerde es nicht ausschliessen. :-)

Ich bin geneigt, darauf zu wetten. Die Schmutzbuckel, die
dem googlebot andere Seiten ausliefern als sonst, werden
bestimmt nicht von Hand aussortiert.

Gruss Rainer

Rainer Kersten

unread,
Aug 2, 2002, 6:33:28 AM8/2/02
to
Boris 'pi' Piwinger(Boris 'pi' Piwinger) meinte am 1.08.2002:

> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
> verwenden, der wesentlich laenger speichert als er soll.

Aha?

Weisst Du da mehr drüber? Irgendwelche Quellen?

Gruss Rainer

Rainer Kersten

unread,
Aug 2, 2002, 6:36:34 AM8/2/02
to
Konni Scheller(Konni Scheller) meinte am 1.08.2002:

> Das willst Du nicht wirklich wissen. Aber ich glaube, ich werde es
> schaffen.

Das Schlimme ist: Es ist ihm zuzutrauen.

Mario Mueller

unread,
Aug 2, 2002, 9:05:20 AM8/2/02
to
Rainer Kersten wrote on Freitag, 2. August 2002 12:32:

> Ich bin geneigt, darauf zu wetten. Die Schmutzbuckel, die
> dem googlebot andere Seiten ausliefern als sonst, werden
> bestimmt nicht von Hand aussortiert.

Kann man nur hoffen, dass die Leute von Google auffällige Seiten vorher
dann trotzdem noch mal anschauen. Google und andere Robots bekommen bei
mir nämlich keine Session-ID, wodurch ein automatisches System durchaus
fälschlicherweise Spaming vermuten könnte.

m.m

--
Englische Grammatik Online - http://www.ego4u.de

Boris 'pi' Piwinger

unread,
Aug 2, 2002, 9:10:30 AM8/2/02
to
Rainer Kersten wrote:

>> Offenbar. Denn diese scheinen einen stark modifizierten DNS-Server zu
>> verwenden, der wesentlich laenger speichert als er soll.
>
> Aha?
>
> Weisst Du da mehr drüber? Irgendwelche Quellen?

Wie ich bereits schrieb, war das deutlich zu beobachten. Zugriffe
unter der alten IP (Parallelbetrieb des Servers fuer einige Tage).

pi

Konni Scheller

unread,
Aug 2, 2002, 9:13:52 AM8/2/02
to
Rainer Kersten <r.ke...@BILKINFO.de> wrote:

> > Das willst Du nicht wirklich wissen. Aber ich glaube, ich werde es
> > schaffen.
>
> Das Schlimme ist: Es ist ihm zuzutrauen.

Witzbold, *DU* hast mich ja erst draufgebracht.

@Steffi: Vorsicht, Rainer kann was. Wird Zeit, dass Du ihn kennenlernst.

Sebastian hatte sich schon so auf Euer Zusammentreffen gefreut, leider
hat es dann nicht geklappt.

Servus,
Konni

Rainer Kersten

unread,
Aug 2, 2002, 7:16:10 AM8/2/02
to
Huschiar Madjidi(Huschiar Madjidi) meinte am 2.08.2002:

> > Huschiar Madjidi(Huschiar Madjidi) meinte am 1.08.2002:
> ^^^^^^^^^^^^^^^^
>
> Warum erscheint hier mein Name doppelt?

Zur Sicherheit...?

> Vielleicht falsche Reader-Einsetllungen?

Nö. Tendenziell suboptimale Programierung. Ich nix
Quellcode.

> > [pagerank Anzeige google taskbar]


> > http://pr.efactory.de/d-pagerank-implementierung.shtml
> Interessanter Artikel, daraus kannst Du zwar nicht erkennen, wie
> objektiv solche Wertungen sind, aber die Funktionsweise ist gut
> erklärt.

Ebendst.

Gruss Rainer

Juergen G Kuehne

unread,
Aug 2, 2002, 9:55:26 AM8/2/02
to
Jens Müller <je...@unfaehig.de> wrote:

> Huschiar Madjidi <hus...@gmx.de> writes:
> > |How often will Googlebot access my web pages?
> >
> > |For most sites, Googlebot should not access your site more than once
> > |every few seconds on average.

und bei inktomi steht:

| Frequency of accesses: Slurp should not access your site more than
| once every five seconds on average. Since network delays are involved
| it is possible over short periods the rate will appear to be slightly
| higher, but the average frequency should remain below once per minute.

> Und wenn's mehr wird, darf man sich beschweren ...

Hmm, Google und viele andere Bots üben in letzter Zeit häufigst das
Crawlen mehrfach am Tag (seit ca. 4 - 5 Monaten). Auch auf Verzeichnisse
zuzugreifen ohne den üblichen Slash am Ende, Beispiel:
www.meineseite.de/verzeichnis anstelle von
www.meineseite.de/verzeichnis/
bekommt jedesmal 301 zurück mit der richtigen Schreibweise...

Neuerdings mehren sich die Zugriffe mit und _ohne_ "www." am Beginn der
URL, togal...

Google-Beispiele:
2.8. bis zum Frühstück <gr> 4 Verzeichnisse gelesen, plus robots.txt
1.8. robots.txt, Verzeichnis1 zweimal in 1 Stunde gelesen
plus Seite gelesen, die er nicht sollte (nofollow)
31.7. robots.txt 3mal
Verzeichnis1 4mal richtig (plus mehrfach ohne Slash)
Verzeichnis2 1mal richtig (plus 6mal ohne Slash)
interessant noch
27.7. in der Zeit 11:56 bis 28.7. 07:00 (unsere Zeit)
Verzeichnis1 25mal ohne Slash, erst am 28.7./07:00 richtig! ;-)
ziemlich blöder Bot ;-) auch wenn ich gern bei Google suche...

Aus einer Antwort auf eine Beschwerde bei inktomi wegen zu häufigem
Crawlen:

| Basically we are crawlling *millions* of sites on a daily basis.
| The program that is hitting your site is accessing what *it*
| thinks is a site once a week. If it is visiting your *server*
| more than once a week, that is usually a sign that it thinks that
| is more than one site at that IP address (or IP addresses).
|
| That said, we have multiple hosts performing the same function,
| so you may be visited as many as seven times in one week (once
| by each host). Are multiple hosts accesing your site multiple
| times a day, or just si3002.inktomi.com?

jep, aus IP-Range...
66.196.65.xxx 8 IPs
66.196.72.xxx 3 IPs
66.196.73.xxx 2 IPs
manche kommen mit Slurp/SI, manche mit Slurp/cat ;-)

| I'll take a closer look at your original email and see what else
| I can tell you about what you're seeing.

Slurp schafft die robots.txt bis zu 3mal in 30 Minuten, und 6 Stunden
später besteht schon wieder Interesse ;-/


Grüsse von
Jürgen

Juergen G Kuehne

unread,
Aug 2, 2002, 9:55:35 AM8/2/02
to
Can Filip Sakrak
<de.comm.infosystems...@usenet-2002-08.sakrak.de> wrote:

> > Wie? Benutzen noch andere Suchmaschinen etwa Googlebot auch?
>

> Der UA-String laesst sich doch beliebig aendern.

Und die IP auch? ;-)

Grüsse von
Jürgen

Wolfgang Ewert

unread,
Aug 2, 2002, 9:49:12 AM8/2/02
to
Hallo Anette, Du teiltest mit:

> > Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten
> > heraus, die Spamdexing betreiben und (bis heute) noch nicht
> > von Google aus der DB rausgeworfen worden sind :-(

> http://www.google.com/contact/spamreport.html

Ach :-( Aus der damaligen Diskussion:

Von: Michael Nahrath Datum:2002-02-24 15:37:05 PST

| Eine Suche nach "Meinersdorf Kirchen Tannroda Groitzsch" führt sogar zu
| 32 fast identischen Seiten.
...
| Beschwerde an Google ist raus.

Und von mir damals auch. Sie sollten sie wenigstens als "sponsored Links"
kennzeichnen :-((

Gruß
Wolfgang

Can Filip Sakrak

unread,
Aug 2, 2002, 9:59:57 AM8/2/02
to
Juergen G Kuehne schrieb:

> Und die IP auch? ;-)

Das macht nur bei DoS-Attacken Sinn.

Viele Gruesse
Can Filip "bitte kein xpost nach d.o.c." Sakrak

Claus Färber

unread,
Aug 2, 2002, 11:03:00 AM8/2/02
to
Juergen G Kuehne <hajuek...@gmx.de> schrieb/wrote:

> Neuerdings mehren sich die Zugriffe mit und _ohne_ "www." am Beginn der
> URL, togal...

Nun, woher soll denn Google auch wissen, dass http://www.meineseite.de
und http://meineseite.de identisch sind?

Und bei den Zugriffen ohne Slash hat sicherlich jemand auf genau diesen
URL verlinkt. Eventuell speichert Google diese URLs nicht, so dass der
Bot jedes Mal neu nachsehen muss.

Claus
--
------------------------ http://www.faerber.muc.de/ ------------------------
OpenPGP: DSS 1024/639680F0 E7A8 AADB 6C8A 2450 67EA AF68 48A5 0E63 6396 80F0

Claus Färber

unread,
Aug 2, 2002, 11:07:00 AM8/2/02
to
Boris 'pi' Piwinger <3....@logic.univie.ac.at> schrieb/wrote:

> Rein spekulativ: Sie koennten die Spider bzgl. der Anzahl der Aufrufe
> in bestimmten Netzen (Class Irgendwas) pro Zeiteinheit beschraenkt haben.

Wäre auch sinnvoll, um ein Netz oder einen Server[1] nicht zu
überlasten.

Claus
___________________
[1] Bei Billighostern können auch recht viele (virtuelle) Server auf ein
und derselben IP-Adresse laufen.

Lars Trebing

unread,
Aug 2, 2002, 11:56:32 AM8/2/02
to
Can Filip Sakrak wrote:

> Das macht nur bei DoS-Attacken Sinn.

^^^^^ ^^^^
Das ist kein Deutsch. "To make sense" ist ein englischer Ausdruck, der
z. B. als "sinnvoll sein" oder "Sinn ergeben" ins Deutsche übersetzt
werden kann.

Wirsing!
ltrebing

Followup gesetzt, bitte beachten!

--
The first time you'll get a Microsoft product that doesn't suck will be
the day they start producing vacuum cleaners.

Lars Trebing | http://www.ltrebing.de/ | mailto:ltre...@ltrebing.de

Rainer Kersten

unread,
Aug 2, 2002, 12:32:28 PM8/2/02
to
Boris 'pi' Piwinger(Boris 'pi' Piwinger) meinte am 2.08.2002:

[Google boykottiert nach Umzug]

> Rein spekulativ: Sie koennten die Spider bzgl. der Anzahl der Aufrufe
> in bestimmten Netzen (Class Irgendwas) pro Zeiteinheit beschraenkt haben.

Nur, wenn jemand umzieht? Und auch nur einige Seiten, andere
nicht?

Glaubichnich.

Gruss Rainer

Rainer Kersten

unread,
Aug 2, 2002, 1:06:22 PM8/2/02
to
Boris 'pi' Piwinger(Boris 'pi' Piwinger) meinte am 2.08.2002:

Hm... Nun, wenn er die alte IP kennt, und darüber immer noch
Antworten bekommt, finde "einige Tage" nicht auffällig.

Gruss Rainer

Markus G. Kloetzer

unread,
Aug 2, 2002, 6:51:29 PM8/2/02
to
Anette Stegmann <anette_s...@gmx.de> wrote/schrieb:

> {2002-08-02 10:48} "Wolfgang Ewert":


>> Auf alle Fälle bekommst Du mit geändertem User-Agent Seiten
>> heraus, die Spamdexing betreiben und (bis heute) noch nicht
>> von Google aus der DB rausgeworfen worden sind :-(

> Siehe auch:
> http://www.google.com/contact/spamreport.html


http://www.google.com/search?sourceid=navclient&q=abuse+kleeneze

Die ersten zwei sind immer noch top-of-the-list obwohl google bereits
auf den Report geantwortet hat. (Hidden Text Spamming)

cu

mgk
--
Man nennt es Lawine. Der Berg ruft nicht, er kommt persönlich.

It is loading more messages.
0 new messages