Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

problème avec %20

1 view
Skip to first unread message

Une Bévue

unread,
Oct 2, 2010, 2:07:43 AM10/2/10
to
j'ai des pbs avec %20...

ce que je fais :
je télécharge avec curl des pages et images dont l'URL est obtenue par
les href et src des pages concernées.

j'enregistre ces images et pages sur mon ordi. je ne change que la
partie dossier du path.
pas d'encodage ni de décodage du nom de fichier.

donc quand il y a des %20 dans l'URL référencée par un href ou src,
firefox 4, ne trouve pas.

ces fichiers sont enregistrés avec des noms du genre :
"mon%20fichier.jpg", par exemple.

si je duplique ce fichier en lui donnant le nom : "mon fichier.jpg" ff 4
ne trouve pas +.

le remplacement des %20 par des espaces dans les noms de fichiers sur
l'ordi ne suffit donc pas.

j'imagine qu'il faut "tout" faire càd remplacer/décoder aussi les URLs
dans les fichiers HTML ? ce qui est + coûteux en temps.

question diagnostic, je suis un peu peaumé car je ne vois pas où est la
véritable source du pb.

pour info, ma commande curl :

curl --create-dirs -f -o "#{f_path}" "#{u_href}"

où f_path est la réplique locale de u_href, ie. seul le nom du dossier
est changé.
--
Je m'intéresse au futur, c'est là que je compte passer
le reste de ma vie.
(Woody Allen)

yamo'

unread,
Oct 2, 2010, 4:42:29 AM10/2/10
to
Salut,

Une Bévue a tapoté, le 02/10/2010 08:07:


> j'ai des pbs avec %20...

À part essayer httrack qui fais ça très bien, je ne sais pas répondre,
je ne connais pas assez bien curl et wget.

--
Stéphane
http://pasdenom.info

Une Bévue

unread,
Oct 2, 2010, 5:13:10 AM10/2/10
to
yamo' <ya...@replyto.invalid> wrote:

> À part essayer httrack qui fais ça très bien, je ne sais pas répondre,
> je ne connais pas assez bien curl et wget.

c'est uniquement dispo par fink, sur Mac OS X ?

notes que je pense que curl ne fait rien dans l'affaire.
je pense que les pages en cause sont celles téléchargées par le
butineur.

je viens de faire l'expérience avec cette page :
<http://blog.savourclub.fr/dossiers/accords-mets-vins/canard-aux-pommes/
?xts=403171&xtor=EPR-15-[]-20101002&xtdt=21433348>

si je laisse faire FF, il me crée un dossier "Canard aux
pommes_fichiers" et je retrouve dans le html sauvegardé des
"Canard%20aux%20pommes_fichiers".

je suis en train d'inspecter mes dossiers/fichiers pour bien piger d'où
provient le pn, pas si évident...

yamo'

unread,
Oct 2, 2010, 6:04:33 AM10/2/10
to
Salut,

Une Bévue a tapoté, le 02/10/2010 11:13:


> c'est uniquement dispo par fink, sur Mac OS X ?

euh...

À part savoir que Mac OS X est un unix je ne connais rien à ce système!

Sur <http://www.httrack.com/page/2/fr/index.html>, on parle de MacPorts.


--
Stéphane
http://pasdenom.info

SAM

unread,
Oct 2, 2010, 6:17:20 AM10/2/10
to
Le 02/10/10 11:13, Une Bévue a écrit :

> yamo'<ya...@replyto.invalid> wrote:
>
>> À part essayer httrack qui fais ça très bien, je ne sais pas répondre,
>> je ne connais pas assez bien curl et wget.
>
> c'est uniquement dispo par fink, sur Mac OS X ?
>
> notes que je pense que curl ne fait rien dans l'affaire.
> je pense que les pages en cause sont celles téléchargées par le
> butineur.
>
> je viens de faire l'expérience avec cette page :
> <http://blog.savourclub.fr/dossiers/accords-mets-vins/canard-aux-pommes/
> ?xts=403171&xtor=EPR-15-[]-20101002&xtdt=21433348>
>
> si je laisse faire FF, il me crée un dossier "Canard aux
> pommes_fichiers" et je retrouve dans le html sauvegardé des
> "Canard%20aux%20pommes_fichiers".

Oui, et ?

Il s'en débrouille très bien, non ?
(sauf qu'il ne sauvegarde pas les images des css...)

> je suis en train d'inspecter mes dossiers/fichiers pour bien piger d'où
> provient le pn, pas si évident...

Il ne devrait n'il y avoir aucun problème

<file:///Users/STEF/Desktop/yt/%C2%BB%20Canard%20aux%20pommes_fichiers/recette15-199x300.jpg>
me trouve bien l'image
tout en montrant l'url traduite (espaces au lieu de %20)
Un copié-collé de cette url traduite nous re-donne :
<file:///Users/STEF/Desktop/yt/%C2%BB%20Canard%20aux%20pommes_fichiers/recette15-199x300.jpg


et Firefox affiche aussi l'image avec cette url ;
<file:///Users/STEF/Desktop/yt/%C2%BB Canard aux
pommes_fichiers/recette15-199x300.jpg>


--
Stéphane Moriaux avec/with iMac-intel

Une Bévue

unread,
Oct 2, 2010, 7:29:55 AM10/2/10
to
yamo' <ya...@replyto.invalid> wrote:

> À part savoir que Mac OS X est un unix je ne connais rien à ce système!
>
> Sur <http://www.httrack.com/page/2/fr/index.html>, on parle de MacPorts.

OK, merci, je n'ai pas assez regardé, mea culpa ))

mais bon :

imyt% sudo port install httrack
---> Computing dependencies for httrack
---> Fetching httrack
---> Attempting to fetch httrack-3.43-9.tar.gz from
http://www.httrack.com/
---> Verifying checksum(s) for httrack
Error: Checksum (md5) mismatch for httrack-3.43-9.tar.gz
Error: Checksum (sha1) mismatch for httrack-3.43-9.tar.gz
Error: Checksum (rmd160) mismatch for httrack-3.43-9.tar.gz
Error: Target org.macports.checksum returned: Unable to verify file
checksums
Log for httrack is at:
/opt/local/var/macports/logs/_opt_local_var_macports_sources_rsync.macpo
rts.org_release_ports_net_httrack/main.log
Error: Status 1 encountered during processing.
To report a bug, see <http://guide.macports.org/#project.tickets>

Une Bévue

unread,
Oct 2, 2010, 7:29:55 AM10/2/10
to
SAM <stephanemor...@wanadoo.fr.invalid> wrote:

> Il s'en débrouille très bien, non ?
> (sauf qu'il ne sauvegarde pas les images des css...)
>
> > je suis en train d'inspecter mes dossiers/fichiers pour bien piger d'où
> > provient le pn, pas si évident...
>
> Il ne devrait n'il y avoir aucun problème

ben ouais, c'est ce que je pense aussi mais, j'en ai rencontrés...
à re-re-re-vérifier, c'est en cours !

0 new messages