Olá.
Eu estou tentando criar uma lista com todos os links de um website e em seguida criar outra lista com todos os links que terminam em 'pdf', mas nesta última lista está adicionando apenas o primeiro link terminado em PDF repetidas vezes. Alguém poderia me ajudar a descobrir onde está o erro?
import requests
import httplib2
import os
from bs4 import BeautifulSoup, SoupStrainer
artigos = []
pdfs = []
http = httplib2.Http()
status, response = http.request('
https://www.snh2021.anpuh.org/site/anais')
for link in BeautifulSoup(response, parse_only=SoupStrainer('a')):
if link.has_attr('href'):
artigos.append(link['href'])
for x in artigos:
if x.endswith('pdf'):
pdfs.append(x)
print(pdfs)