Den 05-06-2012 08:12, Kurt Hansen skrev:
> Den 03/06/12 13.13, Leif Neland skrev:
>> Den 03-06-2012 12:41, Kurt Hansen skrev:
>>> Den 01/06/12 01.34, Leif Neland skrev:
>>>>
>>>> Sitet må checkke på user-agent, fordi jeg fik først en 406 Not
>>>> Acceptable, men da jeg ændrede user-agent til 'Netscape 1.0/CPM3' gik
>>>> det strygende :-)
>>>
>>> wget: unable to resolve host address `1.0'
>>
>> Anførselstegn er din ven :-)
>>
>> wget -r --user-agent "Netscape 1.0/CPM3" www.site.dom
>
> Jo, så virker det, men der downloades hele sitet. Så snart man sætter
> undermapper på, siger den igen "404".
Ja. Med mindre du får en liste over filer, når du med din browser går
ind på en undermappe, så skal du spørge specifikt efter hver fil, for at
serveren vil give dig den.
F.ex.
http://www.paradiss.dk/images/produkter/ giver
Directory Listing Denied
This Virtual Directory does not allow contents to be listed.
Du kan downloade hele sitet, eller rettere de billeder og sider, der er
refereret til, når du starter i roden, eller en anden side. Men altså
kun de billeder, hvis navne står i de sider, du allerede har hentet.
Og så kan du gætte, f.ex. at hvis årsregnskabet 2010 hed
aarsregnskab_2010.pdf, så hedder regnskabet for 2011 nok
aarsregnskab_2011.pdf. Så hvis filen ligger der, men linket til den
først lægges ud efter offentliggørslen, så skal du lige finde en
proxyserver og en diskret børshandler :-)
Hvis Multiphhone Records har fortløbende numre, og kalder deres billeder
mpr-00001-front.jpg, mpr-00001-back.jpg osv, skal der ikke den store
fantasi til at hente alle deres coverfotos.
Leif