SALVAR JSON

15 views
Skip to first unread message

Rafael Pinto

unread,
Sep 8, 2021, 8:37:31 PM9/8/21
to Python Brasil
BOA NOITE PESSOAL 
TD BEM?
ESTOU FAZENDO CÓDIGO WEB SCRAPING PARA PEGAR BANDEIRAS DE MUNICÍPIOS

import requests
from bs4 import BeautifulSoup
import pandas as pd

URL_BASE = 'https://www.mbi.com.br'


def open_url(url):
return requests.get(f'{URL_BASE}{url}')


def soup_code(html):
soup = BeautifulSoup(html, 'html.parser')

return soup.find_all('div', {'class': 'simbolopedia-index-element'})


def get_links():
url = '/mbi/biblioteca/simbolopedia/municipios-estado-sao-paulo-br/'
source_code = open_url(url)

tags_list = soup_code(source_code.text)

tags_list = tags_list[:3]

# Sem brasao
# return [{"name": city.h3.string, "img": city.img["src"], "city_url": city.a['href']} for city in tags_list]

# Com brasao
return [{"name": city.h3.string, "brasao": city.img['src'].replace("-bandeira-mini-", "-brasao-simb-"),
"img": city.img["src"], "city_url": city.a['href']} for city in tags_list]


for city in get_links():
print(f"Nome: {city['name']} -- Bandeira: {URL_BASE + city['img']} -- Brasao: {URL_BASE + city['brasao']}")

QUERIA IMPORTAR  PARA FORMATO JSON
DATAFRAME

Roberto Sousa

unread,
Sep 10, 2021, 7:24:05 AM9/10/21
to python...@googlegroups.com
import json
lista_em_json = json.dumps(sua_lista)

--
--
------------------------------------
Grupo Python-Brasil
https://wiki.python.org.br/AntesDePerguntar
 
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
 
<*> Para sair deste grupo, envie um e-mail para:
python-brasi...@googlegroups.com
---
Você recebeu essa mensagem porque está inscrito no grupo "Python Brasil" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para python-brasi...@googlegroups.com.
Para ver essa discussão na Web, acesse https://groups.google.com/d/msgid/python-brasil/172fe20c-75ab-4113-9c13-ab71cdb8012en%40googlegroups.com.
Reply all
Reply to author
Forward
0 new messages