Am 26.03.22 um 20:48 schrieb Hans-Juergen Schneider:
> Marco Moock wrote:
>>
>> Am Samstag, 26. März 2022, um 18:11:48 Uhr schrieb Hans-Juergen
>> Schneider:
>>
>>> Und weil ich neugierig bin, ob sich jemand dorthin verirrt, lasse ich
>>> mir die Zugriffe anzeigen. Dabei fiel dann auf, dass es innerhalb
>>> kurzer Zeit jeweils hunderte von der selben Adresse waren.
>>
>> Normal bei HTTP(S). Es gibt da Crawler, die die Seiten durchsuchen und
>> Links folgen, um dann die Indexe bei Google & Co zu füllen.
>
> Das glaube ich nicht so recht.
> Warum sollten die eine Seite unablässig ständig neu laden?
> Natürlich könnte ich jetzt erstmal eine Weile mit whois suchen...
Ja, mach das doch mal exemplarisch. Vielleicht findest du den Rechner
oder das Netzwerk von jemandem dem du von deiner Seite erzählt hast.
Oder ist die so "geheim" entstanden das keiner davon wissen kann? Auch
ein spider/Crawler nicht der vielleicht schlichtweg die übergeordnete
Site indizierte. Wenn dort keine robots.txt den weg versperrt dann prüft
der die neue seite vielleicht öfter mal durch um zu sehen ob sie bestand
hat. Ist nur ne Idee, das Alter einer Website kann ja auch ein
suchkriterium sein.
> Weil mein HTML über PHP erzeugt wird, habe ich denen erstmal ab
> dem zehnten Zugriff einen sleep() verordnet. Da stellt sich heraus,
> dass diese Kisten lernfähig sind. Die scheuen das wie der Teufel
> das Weihwasser. Machen immer nur noch neun.
> Aber der Sinn erschließt sich mir nicht.
Vielleicht ein Browser oder anderes tool das einen timeout erkennt und
den so (schlau) umgehen will. Ich rate aber auch nur. whois auf die IP
und du hast einen Anhalt mehr von wem's kommt.
FF bringt seit kurzem IMHO ein web-archives addon mit. Daher: Könnte ja
auch das webarchiv sein. Die zeigen zu den Seiten auch die
speicherhäufigkeit an die durchaus schwankt von x zugriffen pro Tag zu
wenigen pro Woche oder monat. Und man kann änderungen ja nur sinnvoll
verfolgen wenn man die Seite lädt und mit gespeichertem vergleicht.
Bye/
/Kay
--
"Kann ein Wurstbrot die Welt retten?" :-)