Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Duda sobre wget

120 views
Skip to first unread message

Marcel Rodolfo Sanchez Gongora

unread,
Jan 25, 2008, 6:40:11 PM1/25/08
to
Hola amigos. Tengo un problema que no he podido resolver usando wget y
es el siguiente. Cuando tengo una url de descarga que me redirecciona a
otra no se me descarga el archivo sino la pagina.
ejemplo:

wget -c http://www.konakart.com/kkcounter/click.php?id=4
--18:38:26-- http://www.konakart.com/kkcounter/click.php?id=4
=> `click.php?id=4'
Connecting to 10.0.0.1:8080... conectado.
Petición Proxy enviada, esperando respuesta... 302 Moved Temporarily
Localización:
http://www.konakart.com/kits/KonaKart-2.2.2.0-Linux-Install.zip
[siguiendo]
--18:38:29--
http://www.konakart.com/kits/KonaKart-2.2.2.0-Linux-Install.zip
=> `KonaKart-2.2.2.0-Linux-Install.zip'
Connecting to 10.0.0.1:8080... conectado.
Petición Proxy enviada, esperando respuesta... 302 Moved Temporarily
Localización: http://www.konakart.com/index.php [siguiendo]
--18:38:30-- http://www.konakart.com/index.php
=> `index.php'
Connecting to 10.0.0.1:8080... conectado.
Petición Proxy enviada, esperando respuesta... 200 OK
Longitud: no especificado [text/html]

100%[====================================>] 12,115
19.61K/s

18:38:32 (19.60 KB/s) - `index.php' saved [12115]


--
Marcel Sánchez Góngora
Debian Lenny GNU/Linux
Linux User #382151
Est. IV año
Universidad de las Ciencias Informáticas
"Mañana te darás cuenta que hoy no sabes nada"

signature.asc

"Matías A. Bellone"

unread,
Jan 25, 2008, 6:50:09 PM1/25/08
to
Marcel Rodolfo Sanchez Gongora wrote:
> Hola amigos. Tengo un problema que no he podido resolver usando wget y
> es el siguiente. Cuando tengo una url de descarga que me redirecciona a
> otra no se me descarga el archivo sino la pagina.

Esto no es problema de wget sino es un comportamiento deseado. No por el
usuario sino por el dueño de la página que tiene controles internos para
evitar este tipo de cosas.

Normalmente ésto se hace restringiendo los accesos a determinados
User-Agents. Los que son identificados por una cabecera esepcial. Por
suerte wget está al tanto de esto y - basándome en tu ejemplo y
utlizando el wget disponible en Lenny - se puede modificar el User-Agent
que reporta wget con la opción -U.

Lo que es más -U "" hace que dicha cabecera ni siquiera sea enviada.
Probé utilizar esta opción con tu ejemplo y aparenta funcionar como esperas.

Saludos,
Toote

PD: el hecho que el problema viene del lado del servidor es obvio si
lees que la salida de wget reporta que el servidor le respondió con "302
Moved Temporarily" a wget.


--
To UNSUBSCRIBE, email to debian-user-s...@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listm...@lists.debian.org

Luis Rodrigo Gallardo Cruz

unread,
Jan 25, 2008, 7:10:14 PM1/25/08
to
On Fri, Jan 25, 2008 at 06:39:58PM -0500, Marcel Rodolfo Sanchez Gongora wrote:
> Hola amigos. Tengo un problema que no he podido resolver usando wget y
> es el siguiente. Cuando tengo una url de descarga que me redirecciona a
> otra no se me descarga el archivo sino la pagina.
> ejemplo:
>
> wget -c http://www.konakart.com/kkcounter/click.php?id=4
> --18:38:26-- http://www.konakart.com/kkcounter/click.php?id=4
> => `click.php?id=4'
> Connecting to 10.0.0.1:8080... conectado.
> Petición Proxy enviada, esperando respuesta... 302 Moved Temporarily
> Localización:
> http://www.konakart.com/kits/KonaKart-2.2.2.0-Linux-Install.zip
> [siguiendo]

^^^^^^^^^

Como puedes ver, wget sí está siguiendo la redirección. Lo que suele
pasar en muchos sitios es que la redirección revisa alguna cookie que
la primera página puso en tu navegador. Como wget no tiene la cookie,
el sitio lo redirige a algún otro lado.

Se supone que wget puede leer el archivo de cookies de FF (y
similares). Lee el man y ve si eso te sirve. Otra opción es comenzar
la descarga en el navegador, ver cual es la URL definitiva y pasarle
eso a wget.

signature.asc

Marcel Rodolfo Sanchez Gongora

unread,
Jan 26, 2008, 10:40:10 PM1/26/08
to
El vie, 25-01-2008 a las 21:49 -0200, "Matías A. Bellone" escribió:
> Marcel Rodolfo Sanchez Gongora wrote:
> > Hola amigos. Tengo un problema que no he podido resolver usando wget y
> > es el siguiente. Cuando tengo una url de descarga que me redirecciona a
> > otra no se me descarga el archivo sino la pagina.
>
> Esto no es problema de wget sino es un comportamiento deseado. No por el
> usuario sino por el dueño de la página que tiene controles internos para
> evitar este tipo de cosas.
>
> Normalmente ésto se hace restringiendo los accesos a determinados
> User-Agents. Los que son identificados por una cabecera esepcial. Por
> suerte wget está al tanto de esto y - basándome en tu ejemplo y
> utlizando el wget disponible en Lenny - se puede modificar el User-Agent
> que reporta wget con la opción -U.
>
> Lo que es más -U "" hace que dicha cabecera ni siquiera sea enviada.
> Probé utilizar esta opción con tu ejemplo y aparenta funcionar como esperas.
Muchas gracias por la respuesta Matías...
signature.asc
0 new messages