Hallo,
es gab zwar schon zwei Anfragen wegen diesem Thema, habe aber Abstand
genommen in diesen Threads was zu schreiben ;-).
Sitemap-Fehler:
"Bei Tests von URLs auf Ihrer Sitemap wurde festgestellt, dass einige
URLs für Googlebot nicht zugänglich waren, da sie zu viele
Weiterleitungen enthielten. Ersetzen Sie bitte in Ihrer Sitemap die
Weiterleitungs-URLs jeweils durch die direkte Ziel-URL (das
Weiterleitungsziel). Alle gültigen URLs werden weiterhin übermittelt."
Ich habe nun mit LiveHTTP headers schon mal die fehlererzeugende URL
geprüft.
Ein PDF-File wird anscheinend nicht in einem Durchgang runtergeladen,
HTTP Status 206 Partial Content, es wird dann wohl noch zweimal vom
Google-Bot versucht den Rest nachzuladen. Dadurch läuft er wieder in
meinen 301-Redirect (Problem mit und ohne WWW) und bricht nach dem 3.
Aufruf ab.
Hat jemand einen Lösungsvorschlag? Danke!
Hier das Log, wenn ich die URL im Browser aufrufe:
http://meine-domain.de/verzeichnis1/verzeichnis2/googlehoo.pdf
GET /verzeichnis1/verzeichnis2/googlehoo.pdf HTTP/1.1
Host: meine-domain.de
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.14)
Gecko/20080404 Firefox/2.0.0.14
Accept: text/xml,application/xml,application/xhtml+xml,text/
html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: de-de,de;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
HTTP/1.x 301 Moved Permanently
Date: Tue, 06 May 2008 16:04:01 GMT
Server: Apache/1.3.34 Ben-SSL/1.55
Location: http://www.meine-domain.de/verzeichnis1/verzeichnis2/googlehoo.pdf
Keep-Alive: timeout=2, max=199
Connection: Keep-Alive
Transfer-Encoding: chunked
Content-Type: text/html; charset=iso-8859-1
----------------------------------------------------------
http://www.meine-domain.de/verzeichnis1/verzeichnis2/googlehoo.pdf
GET /verzeichnis1/verzeichnis2/googlehoo.pdf HTTP/1.1
Host: www.meine-domain.de
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.14)
Gecko/20080404 Firefox/2.0.0.14
Accept: text/xml,application/xml,application/xhtml+xml,text/
html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: de-de,de;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Range: bytes=65536-67454,65536-65537
HTTP/1.x 206 Partial Content
Date: Tue, 06 May 2008 16:04:02 GMT
Server: Apache/1.3.34 Ben-SSL/1.55
Last-Modified: Sun, 09 Mar 2008 00:38:36 GMT
Etag: "550858c-11a9a-47d3318c"
Accept-Ranges: bytes
Content-Length: 2123
Keep-Alive: timeout=2, max=200
Connection: Keep-Alive
Content-Type: multipart/byteranges; boundary=4820817275cd
----------------------------------------------------------
http://www.meine-domain.de/verzeichnis1/verzeichnis2/googlehoo.pdf
GET /verzeichnis1/verzeichnis2/googlehoo.pdf HTTP/1.1
Host: www.meine-domain.de
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.14)
Gecko/20080404 Firefox/2.0.0.14
Accept: text/xml,application/xml,application/xhtml+xml,text/
html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: de-de,de;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Range: bytes=68186-69265,72118-72345
HTTP/1.x 206 Partial Content
Date: Tue, 06 May 2008 16:04:02 GMT
Server: Apache/1.3.34 Ben-SSL/1.55
Last-Modified: Sun, 09 Mar 2008 00:38:36 GMT
Etag: "550858c-11a9a-47d3318c"
Accept-Ranges: bytes
Content-Length: 1510
Keep-Alive: timeout=2, max=200
Connection: Keep-Alive
Content-Type: multipart/byteranges; boundary=482081725918
----------------------------------------------------------
http://www.meine-domain.de/verzeichnis1/verzeichnis2/googlehoo.pdf
GET /verzeichnis1/verzeichnis2/googlehoo.pdf HTTP/1.1
Host: www.meine-domain.de
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.14)
Gecko/20080404 Firefox/2.0.0.14
Accept: text/xml,application/xml,application/xhtml+xml,text/
html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: de-de,de;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Range: bytes=67455-68185,69266-72117
HTTP/1.x 206 Partial Content
Date: Tue, 06 May 2008 16:04:02 GMT
Server: Apache/1.3.34 Ben-SSL/1.55
Last-Modified: Sun, 09 Mar 2008 00:38:36 GMT
Etag: "550858c-11a9a-47d3318c"
Accept-Ranges: bytes
Content-Length: 3785
Keep-Alive: timeout=2, max=199
Connection: Keep-Alive
Content-Type: multipart/byteranges; boundary=4820817275cd
----------------------------------------------------------