Request e Beautiful Soup

9 views
Skip to first unread message

Eudiclei Madson

unread,
Aug 7, 2022, 11:16:55 AM8/7/22
to Python Brasil
Tenho um código que tem como objetivo retornar um texto através de uma requisição com o Request e seleção desse texto retornado usando o  Beautiful Soup.
Estou tentando verificar se um domínio no Registro.br está disponível mas independente do domínio que se coloque na url o retorno está sendo sempre o mesmo.

####################################
import requests
from bs4 import BeautifulSoup  

page = requests.get(url)
page.encoding = "utf-8"
soup = BeautifulSoup(page.text, 'html.parser')
print(soup.find_all('p')[4].get_text())
#######################################
Output:
Domínio disponível para registro.

Alguém tem alguma ideia do que pode está acontecendo?

Obrigado a todos os Devs !

Anderson Souza

unread,
Aug 7, 2022, 12:08:18 PM8/7/22
to python...@googlegroups.com
Olá.

Olhei aqui rapidamente, não precisa usar o BS.

Antes mesmo de tentar o webscraping, veja se não tem API. 
No seu caso, ao acessar o navegador e fazer a busca do domínio desejado, no network do navegador ele chamará o link abaixo.


Aqui está um code no Colab, o retorno é um JSON, em seguida insiro em um dataframe. O restante é contigo.


Anderson

Eudiclei Alencar

unread,
Aug 7, 2022, 12:13:17 PM8/7/22
to python...@googlegroups.com
Valeu, ajudou bastante!
Obrigado!

--
--
------------------------------------
Grupo Python-Brasil
https://wiki.python.org.br/AntesDePerguntar
 
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
 
<*> Para sair deste grupo, envie um e-mail para:
python-brasi...@googlegroups.com
---
Você recebeu essa mensagem porque está inscrito no grupo "Python Brasil" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para python-brasi...@googlegroups.com.
Para ver essa discussão na Web, acesse https://groups.google.com/d/msgid/python-brasil/CA%2Bg6ALDAQ_jhjsjWjxceS4ksCHiGTsj8BLdeaUXOSCvTRzDH%3Dw%40mail.gmail.com.
Reply all
Reply to author
Forward
0 new messages