(gitlaw) Leis da Alemanha no github

81 views
Skip to first unread message

Vitor Baptista

unread,
Aug 8, 2012, 1:02:57 AM8/8/12
to thac...@googlegroups.com

Pedro Markun

unread,
Aug 8, 2012, 8:59:34 AM8/8/12
to thac...@googlegroups.com
cool :)

estão usando o markdown.

O João Holanda comentou comigo que já da pra achar as leis em formato XML no portal de alguma maneira... seria bacana fazer essa experiência de transformar tudo em markdown e jogar no git... topa, Vitor? :)

abs,
Pedro Markun

2012/8/8 Vitor Baptista <vi...@vitorbaptista.com>

--
Você recebeu esta mensagem porque está cadastrado no grupo "Transparência Hacker"
Para enviar uma mensagem a todo o grupo, escreva para thac...@googlegroups.com
Para não receber mais mensagens, envie um email para thackday+u...@googlegroups.com
Para mais informações, ou para ler mensagens arquivadas deste grupo, visite http://groups.google.com/group/thackday?hl=pt-BR

Vamoss

unread,
Aug 8, 2012, 10:22:09 AM8/8/12
to thac...@googlegroups.com
Eu topo fazer o mesmo com as leis brasileiras, vamos fazer um multirão?

Abs!

Vitor Baptista

unread,
Aug 8, 2012, 10:26:37 AM8/8/12
to thac...@googlegroups.com


On Aug 8, 2012 10:00 AM, "Pedro Markun" <pe...@esfera.mobi> wrote:
> O João Holanda comentou comigo que já da pra achar as leis em formato XML no portal de alguma maneira... seria bacana fazer essa experiência de transformar tudo em markdown e jogar no git... topa, Vitor? :)

Estão no lexml?

Vou dar uma olhada. Acho um bom primeiro passo pra ideia mais completa do gitlaw :-)

Leonardo Cezar

unread,
Aug 8, 2012, 10:41:46 AM8/8/12
to thac...@googlegroups.com
2012/8/8 Vitor Baptista <vi...@vitorbaptista.com>:

> Estão no lexml?
>
> Vou dar uma olhada. Acho um bom primeiro passo pra ideia mais completa do
> gitlaw :-)

Além do lexml, parece que o Jonas Abreu construiu um crawler[1]
interessante para extrair as leis. Talvez mexer no motor de extração
para converter em markdown.

1) https://github.com/jonasabreu/leis-federais#readme
2) https://github.com/jonasabreu/leis

Abraço

-Leo
--
Leonardo Cezar
http://postgreslogia.wordpress.com

Sérgio Storch

unread,
Aug 8, 2012, 11:08:46 AM8/8/12
to thac...@googlegroups.com, André Lima
Amigos, como estão para combinar um hackday específico sobre o Código Florestal, que tal fazer barba, cabelo e bigode com ele, como um lab? E talvez, a partir dele, cercar todo o cipoal da legislação ambiental: Resíduos Sólidos etc? Acho que esse trabalho pode se integrar muito bem com as ações em níveis local, estadual e federal do movimento socioambiental. 

Pode ser legal, mesmo que possa demorar um pouco mais, escolher uma data em que seja possível a presença do André Lima, que  faz há anos, em Brasília, o monitoramento no Legislativo e Executivo para as ONGs socioambientais. Estou copiando para ele ficar em contato direto com vocês. Agora começa a fazer também na questão de mobilidade urbana. 

Será que isso pode de alguma forma cruzar com o projeto da Rockefeller Foundation?

Se agendarem para depois de 26/8, eu participarei também. 

Um abraço a todos

Sérgio Storch
11-3666.9005 - 11-9753.9701




Em 8 de agosto de 2012 02:02, Vitor Baptista <vi...@vitorbaptista.com> escreveu:

--

João Holanda

unread,
Aug 8, 2012, 1:08:52 PM8/8/12
to thac...@googlegroups.com
Se precisarem de ajuda com os textos, estou à disposição, inclusive para trocarmos idéias e discutirmos dificuldades para tratar esses textos.

Abs

João Holanda

Enviado via iPad

Pedro Markun

unread,
Aug 8, 2012, 1:24:20 PM8/8/12
to thac...@googlegroups.com
João,

me lembro de você ter comentado que era possível acessar a estrutura XML das leis publicamente. Onde achamos isso?

abs,
Pedro Markun

2012/8/8 João Holanda <joao.h...@gmail.com>

Vitor Baptista

unread,
Aug 8, 2012, 1:26:59 PM8/8/12
to thac...@googlegroups.com
Oi Leonardo,

Em 8 de agosto de 2012 11:41, Leonardo Cezar <lhc...@gmail.com> escreveu:
Além do lexml, parece que o Jonas Abreu construiu um crawler[1]
interessante para extrair as leis. Talvez mexer no motor de extração
para converter em markdown.

1) https://github.com/jonasabreu/leis-federais#readme
2) https://github.com/jonasabreu/leis

Valeu pelo link. Mas acho que vai ser mais fácil criar a estrutura a partir do XML. Dei uma olhada no HTML e queria evitar ficar dependente desse formato...

Abraços,
Vítor. 

Pedro Markun

unread,
Aug 8, 2012, 1:41:20 PM8/8/12
to thac...@googlegroups.com
http://www.lexml.gov.br/urn/urn:lex:br:senado.federal:projeto.lei;pls:2011-08-23;497

pelo que entendi só tem para o projeto da lei. João?

2012/8/8 Vitor Baptista <vi...@vitorbaptista.com>

--

João Holanda

unread,
Aug 8, 2012, 7:39:13 PM8/8/12
to thac...@googlegroups.com
Na pior das hipóteses, acho que da para conseguir algumas leis também. O que vocês querem exatamente?

João 

Enviado via iPhone

Pedro Markun

unread,
Aug 8, 2012, 7:40:51 PM8/8/12
to thac...@googlegroups.com
Joao,

a gente quer fazer algo parecido com o repositorio alemão.

É um repositório git com todas as leis vertidas de XML pra uma sintaxe simplificada Markdown.

abs,
Pedro Markun

2012/8/8 João Holanda <joao.h...@gmail.com>
Na pior das hipóteses, acho que da para conseguir algumas leis também. O que vocês querem exatamente?

João Holanda

unread,
Aug 8, 2012, 11:33:00 PM8/8/12
to thac...@googlegroups.com
O parser ainda não esta pronto para um universo tão abrangente (mais de 220.000 normas). E nesse semestre não seria possível pois estamos concluindo outros projetos prioritarios. De todo modo, seria um investimento de longo prazo, pois quanto mais nos afastamos no tempo menor é a confiabilidade dos textos de norma.  Não poderíamos começar com um universo mais restrito, como leis ordinárias de um determinado período, que seria suficiente para uma prova de conceito?

Abs

João 

Enviado via iPad

Pedro Markun

unread,
Aug 8, 2012, 11:35:07 PM8/8/12
to thac...@googlegroups.com
Claro :)

2012/8/9 João Holanda <joao.h...@gmail.com>

Frederico Bortolato

unread,
Oct 4, 2012, 6:51:09 PM10/4/12
to thac...@googlegroups.com
João e demais, tudo bem?

Temos uma base de dados de legislação aqui na Alesp, mas os textos das normas estão em HTML sem nenhum tipo de marcação semântica ou mais estruturada de forma que seja possível extrair informações do documento. Tenho especial interesse em estudar estratégias para abordar isso e conseguirmos semantizar essa base (usando o LexML, por exemplo), mas não sei por onde começar.

Gostaria de algumas dicas ou informações que pudessem ajudar neste sentido. Esse parser é adaptável e está em código aberto? Onde posso pesquisar mais sobre tudo isso?

Forte abraço,

Frederico.

João Holanda

unread,
Oct 5, 2012, 4:01:21 AM10/5/12
to thac...@googlegroups.com
Oi, Frederico

O parser foi feito em scala, é aberto e  já está disponível para download no portal de dados abertos do Senado. 

Infelizmente, não pudemos fazer algo mais apropriado para código aberto, com documentação, fórum etc. Acho que só valeria a pena investir nisso se houvesse pessoas e instituições interessadas.
Por isso, o melhor por hora seria conversar com quem o desenvolveu. Estou de ferias mas vou pedir para ele entrar em contato com você.

Abs

João 

Enviado via iPhone

Pedro Markun

unread,
Oct 5, 2012, 9:34:45 AM10/5/12
to thac...@googlegroups.com
Na THacker tem gente interessada _o/

Manda um sample pra gente, Frederico.

Eu ainda insisto que tem um caminho legal pra gente tentar, simplificando o markup ao invés de complexificar.

abs,
Pedro Markun

2012/10/5 João Holanda <joao.h...@gmail.com>

Capi Etheriel

unread,
Oct 5, 2012, 9:59:47 AM10/5/12
to thac...@googlegroups.com
João, o novo código florestal altera/substitui um bocado de leis né. Dei uma olhada em http://www.lexml.gov.br/urn/urn:lex:br:camara.deputados:projeto.lei;pl:1999;1876 e ele tem links pras leis que ele altera ou substitui (várias). Seria interessante pra fazer a conversão e já colocar num repo git, fazendo históricos e diffs.

Como se trata de um projeto de lei com muita atenção, seria fácil conseguir sentar uns hackers pra fazer esse trabalho de converter de XML pra markdown/gitlaw. E é um subconjunto controlado. Você acha que rola?

João Holanda

unread,
Oct 5, 2012, 1:34:39 PM10/5/12
to thac...@googlegroups.com
Claro que rola! Só temos que ver quantas pedras vamos ter que carregar ;) Você deu uma olhada na versão em XML desse pl? nós temos um programa que extrai automaticamente todas as referencias a leis. 

Abs

João 

Enviado via iPad

Capi Etheriel

unread,
Oct 8, 2012, 3:39:39 PM10/8/12
to thac...@googlegroups.com
sim, ele tem links pras leis mas elas não tem o texto disponível em xml :/

João Holanda

unread,
Oct 9, 2012, 4:49:57 AM10/9/12
to thac...@googlegroups.com
Tem sim

Enviado via iPhone

João Holanda

unread,
Oct 9, 2012, 4:58:04 AM10/9/12
to thac...@googlegroups.com

Outras Publicações
Alteração
2011-12-07
Senado Federal (application/pdf)

Alteração
2011-12-06
Senado Federal (application/pdf)

Leitura
2011-06-01
[ Arquivo no formato LexML ] Senado Federal (application/zip)

Publicação Original
2011-06-01
Senado Federal (application/pdf)





 Veja o arquivo em formato lexml. Estou em conexão. A tarde volto de ferias. Aí fica mais fácil dar um apoio. 

Abs 
João 

Enviado via iPhone

Em 08/10/2012, às 16:39, Capi Etheriel <barra...@gmail.com> escreveu:

Capi Etheriel

unread,
Oct 9, 2012, 8:45:12 AM10/9/12
to thac...@googlegroups.com
oi joão
a proposta de lei tem sim, mas as leis linkadas na proposta não tem em xml.

João Holanda

unread,
Oct 9, 2012, 9:57:42 AM10/9/12
to thac...@googlegroups.com
Ah, tá...

A gente ainda não converteu as normas mas apenas as proposições. 
Hoje a tarde avalio a situação e respondo. Se trabalharmos juntos da pra fazer rapidamente. 

Abs

João 

Enviado via iPhone
Reply all
Reply to author
Forward
0 new messages