Jeg har fået besøg af en crawler fra
statistico.dk. Angiveligt er det
en crawler der samler information om danske domæner. Det lyder jo
vældigt fornuftigt, men den har godt nok ikke en pæn adfærd:
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET / HTTP/1.1" 200 1921
"-" "Statastico DK bot - Learn more at:
statastico.dk/bot"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET /ucp.php?mode=login
HTTP/1.1" 404 205 "-" "Mozilla/5.0 (X11; U; Linux i686; ru;
rv:1.9.2.24) Gecko/20111107 Ubuntu/10.04 (lucid)
Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET
/3rdparty/speller/spellChecker.js HTTP/1.1" 404 230 "-"
"Mozilla/5.0 (X11; U; Linux i686; ru; rv:1.9.2.24)
Gecko/20111107 Ubuntu/10.04 (lucid) Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET /admin/login.asp
HTTP/1.1" 404 213 "-" "Mozilla/5.0 (X11; U; Linux i686; ru;
rv:1.9.2.24) Gecko/20111107 Ubuntu/10.04 (lucid)
Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET /index.php/admin/
HTTP/1.1" 404 214 "-" "Mozilla/5.0 (X11; U; Linux i686; ru;
rv:1.9.2.24) Gecko/20111107 Ubuntu/10.04 (lucid)
Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET /umbraco/login.aspx
HTTP/1.1" 404 216 "-" "Mozilla/5.0 (X11; U; Linux i686; ru;
rv:1.9.2.24) Gecko/20111107 Ubuntu/10.04 (lucid)
Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET /admincp/ HTTP/1.1"
404 206 "-" "Mozilla/5.0 (X11; U; Linux i686; ru;
rv:1.9.2.24) Gecko/20111107 Ubuntu/10.04 (lucid)
Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET
/wp-content/plugins/wp-e-commerce/ HTTP/1.1" 404 231 "-"
"Mozilla/5.0 (X11; U; Linux i686; ru; rv:1.9.2.24)
Gecko/20111107 Ubuntu/10.04 (lucid) Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET /typo3/ HTTP/1.1"
404 204 "-" "Mozilla/5.0 (X11; U; Linux i686; ru;
rv:1.9.2.24) Gecko/20111107 Ubuntu/10.04 (lucid)
Firefox/3.6.24"
46.4.130.28 - - [07/May/2012:08:18:56 +0200] "GET /admin/Systemfiles/
HTTP/1.1" 404 216 "-" "Mozilla/5.0 (X11; U; Linux i686; ru;
rv:1.9.2.24) Gecko/20111107 Ubuntu/10.04 (lucid)
Firefox/3.6.24"
Jeg har følgende anker:
1) Kigger ikke efter robots.txt
2) Sløret UA
3) Uregulerede requests
4) )Og det er den værste) aktiv proben efter administrative interfaces.
Har i andre set noget tilsvarende, og i givet fald, har i fundet ud
af om det er et joe-job, eller en decideret skummel crawler?
--
/Wegge
Leder efter redundant peering af dk.*,linux.debian.*