Comecei a fazer o robo com o script abaixo e quando printei na tela ele acabou um formulário ,parece que eu acabei printando o próprio formulaio de login.Mas o que eu queria era logar na página e exibir a pagina interna para depois naveganar nela.
mas eles não estão me dizendo muita coisa ,se alguem souber onde tenha alguma documentação mais completa ou me dar uma luz para eu proseguir na minha pesquisa,nunca fiz algo parecido antes.
# -*- coding: utf-8 -*-
import mechanize
import cookielib
from BeautifulSoup import BeautifulSoup
#cria um navegador, um browser de codigo...
br = mechanize.Browser()
email = 'login'
senha = 'senha'
# Prepara para tratar cookies...
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
# Ajusta algumas opções do navegador...
br.set_handle_equiv(True)
br.set_handle_gzip(False)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
# Configura o user-agent.
# Do ponto de vista do servidor, o navegador agora o Firefox.
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11;\
U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615\
Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
# Pronto! Agora é navegar, acessando a URL usando o método HTTP GET
br.open(url)
# Se existirem formulários, você pode selecionar o primeiro (#0), por exemplo...
br.select_form(nr=0)
# Para mostrar os formularios e ver os campos a serem preenchidos,
# use um for sobre o br.forms()
for f in br.forms():
print f
# Preencher o formulário com os dados de login...
br.form['cod_produtor'] = email
br.form['cod_senha'] = senha
# Enviar o formulário usando o método HTTP POST
br.submit()
# E finalmente, busque o HTML retornado:
html = br.response().read()
soup = BeautifulSoup(html)
print soup.prettify()