Listar todos os links de um site

4,752 views
Skip to first unread message

Fernando Correa da Conceição

unread,
Aug 10, 2010, 2:26:58 PM8/10/10
to lista...@googlegroups.com
Primeiro pe�o desculpas se isso sair do assunto da lista, embora eu
acredite que seja relacionado.
Quero mudar meu site que atualmente em joomla para o drupal, uma das
preocupa��es que eu tenho � quanto aos endere�os que existem agora no
site, que depois da migra��o ser�o completamente diferentes, o que
planejo fazer nesse caso � ir redirecionando os endere�os antigos para
os novos usando o c�digo 301 (redirecionamento permanente).
A quest�o � que eu precisaria ter uma lista de todos os links que
existem no meu site para simplificar isso de ir criando os
redirecionamentos de forma preventiva, em vez de ir esperando que alguem
acesse um endere�o que n�o exista para mim consertar ele.
Alguem conhece algum programa ou pagina na internet que pudesse pegar um
site que esta online e criasse isso, uma lista com todos os links para
paginas do proprio site?

Obrigado

--
Fernando Correa da Concei��o
http://www.jaguaribe.net

Cesar Scur

unread,
Aug 10, 2010, 8:39:56 PM8/10/10
to lista...@googlegroups.com
Duas alternativas que eu consegui pensar rapidamente são:
1- Você escreve um script que pega a index e lista todos os links dela. Então re executa ela mesma para os links novos encontrados recursivamente.
2- Você encontra algum software que faça download do site inteiro em html. Eu tinha um, mas não consegui encontrar o nome pra passar, mas existe. É tipo o salvar do browser, porem recursivo. Depois é só olhar o nome dos arquivos, cada um vai ser um link.

Seila, espero ter ajudado.

2010/8/10 Fernando Correa da Conceição <conceicao...@gmail.com>
Primeiro peço desculpas se isso sair do assunto da lista, embora eu acredite que seja relacionado.
Quero mudar meu site que atualmente em joomla para o drupal, uma das preocupações que eu tenho é quanto aos endereços que existem agora no site, que depois da migração serão completamente diferentes, o que planejo fazer nesse caso é ir redirecionando os endereços antigos para os novos usando o código 301 (redirecionamento permanente).
A questão é que eu precisaria ter uma lista de todos os links que existem no meu site para simplificar isso de ir criando os redirecionamentos de forma preventiva, em vez de ir esperando que alguem acesse um endereço que não exista para mim consertar ele.

Alguem conhece algum programa ou pagina na internet que pudesse pegar um site que esta online e criasse isso, uma lista com todos os links para paginas do proprio site?

Obrigado

--
Fernando Correa da Conceição
http://www.jaguaribe.net

--
---
Você recebeu esta mensagem por estar inscrito no grupo "PHP BR"

*** NÃO ESQUEÇA: As regras do grupo estão disponíveis em nossa Wiki:
http://wiki.phpbr.com.br/index.php/Regras_de_Utiliza%C3%A7%C3%A3o_da_Lista

Para enviar mensagens para o grupo, envie e-mails para lista...@googlegroups.com
Para cancelar sua inscrição neste grupo, envie e-mail para lista-phpbr...@googlegroups.com
Para mais opções visite este grupo em: http://groups.google.com/group/lista-phpbr



--
Grato,
Cesar Scur




Silvano Girardi Jr

unread,
Aug 11, 2010, 10:00:05 AM8/11/10
to lista...@googlegroups.com
Fernando,
não há relação alguma entre o formato antigo e o novo formato? Se
houver, você faz uma regra genérica com mod_rewrite.

Silvano

2010/8/10 Fernando Correa da Conceição <conceicao...@gmail.com>:

> Primeiro peço desculpas se isso sair do assunto da lista, embora eu acredite


> que seja relacionado.
> Quero mudar meu site que atualmente em joomla para o drupal, uma das

> preocupações que eu tenho é quanto aos endereços que existem agora no site,
> que depois da migração serão completamente diferentes, o que planejo fazer
> nesse caso é ir redirecionando os endereços antigos para os novos usando o
> código 301 (redirecionamento permanente).
> A questão é que eu precisaria ter uma lista de todos os links que existem no


> meu site para simplificar isso de ir criando os redirecionamentos de forma

> preventiva, em vez de ir esperando que alguem acesse um endereço que não


> exista para mim consertar ele.
> Alguem conhece algum programa ou pagina na internet que pudesse pegar um
> site que esta online e criasse isso, uma lista com todos os links para
> paginas do proprio site?
>
> Obrigado
>
> --

Diogo Baracho

unread,
Aug 10, 2010, 11:30:25 PM8/10/10
to lista...@googlegroups.com
Fernando recomendo usar o http://www.webceo.com/ poderá ter toda a lista de links do teu site que está indexada em sistemas de busca como Google. Depois disso você poderá analisar a estrutura dos links e criar redirect  de forma dinamica sobre o padrão de links (digo isso pq não sei o tamanho do teu site e considerando que a geração de links segue estrutura logica fica mais facil dessa maneira ou se preferir pode fazer redirect exclusivo link por link). Já fiz este tipo de redirect.


Diogo Baracho | 11 9464-4601
_________________________
http://www.W3UP.com.br

Leo Pinheiro

unread,
Aug 10, 2010, 8:47:24 PM8/10/10
to lista...@googlegroups.com
Cara, talvez não tenha entendido.. mais mandar localizar os href não adiantaria ?

Em 10 de agosto de 2010 21:39, Cesar Scur <csr...@gmail.com> escreveu:

Marcio Bigolin

unread,
Aug 10, 2010, 8:58:28 PM8/10/10
to lista...@googlegroups.com
> 1- Você escreve um script que pega a index e lista todos os links dela.
> Então re executa ela mesma para os links novos encontrados recursivamente.
Acho essa mais interessante!


> 2- Você encontra algum software que faça download do site inteiro em html.
> Eu tinha um, mas não consegui encontrar o nome pra passar, mas existe. É
> tipo o salvar do browser, porem recursivo. Depois é só olhar o nome dos
> arquivos, cada um vai ser um link.

Um programa que faça isso.
http://www.httrack.com/

Cesar Scur

unread,
Aug 11, 2010, 6:04:09 PM8/11/10
to lista...@googlegroups.com
É verdade Leo, de repente um software que faça o mapa do site para SEO (search engine optimization) de conta do recado. E suma eles são o algoritmo que eu descrevi, um crawler que acessa links recursivamente.

2010/8/10 Leo Pinheiro <leopin...@gmail.com>
Reply all
Reply to author
Forward
0 new messages