Outra pergunta. Por que vocês estão refazendo este trabalho? Já não
existe um dicionário para o Firefox chamado Vero?
Para o corretor gramatical ele não funciona, já que não tem anotações
morfológicas. Vou ter que usar o do projeto Natura mesmo.
Minha idéia é escrever um script que me auxilie na revisão desse
dicionário. Nesse script eu uso o Hunspell com o dicionário do Vero
para revisar o dicionário pt-PT do projeto Natura. Acredito que com
esse auxilio o trabalho fique menos chato, já que o Hunspell deve
muitas vezes sugerir a correção, seria só aceitar.
Depois de um tempo eu poderia pensar em alguma forma de automatizar o
processo, por exemplo, poderia aceitar uma sugestão automaticamente
quando o Hunspell sugerir apenas uma mudança de acentuação ou a
remoção de um "c" mudo.
Vocês que já tiveram experiência nisso, acham que iria funcionar?
Muito obrigado,
William
2009/9/25 William Colen <willia...@gmail.com>:
Eu tenho os arquivos da pasta DIC do svn da natura com uns 99%
já em pt-BR.
Também criei arquivos DIC extras com milhares de palavras
adicionais.
Sobre o jspell, pouco entendo pois só uso como fonte do dic
hunspell.
Não mexo nisso desde janeiro, espero acabar ainda em 2009. :-)
Ainda tenho essas etapas:
1) criar um programa que converta as palavras pra nova
ortografia (comparando com uma lista com todas as palavras
modificadas, devem ser umas 300).
2) achar um jeito de listar todas as palavras possíveis do
dicionário hunspell (suponho que seja possível com executável
hunspell)
3) aplicar item 1 item 2
4) Versão beta!
5) adicionar mais palavras (umas 2000)
6) remover palavras (umas 10000)
7) versão final!
[]s
Em 25/09/2009 09:59, Citando a mensagem de William Colen:
Claro que adaptar é trabalhoso, mas a longo prazo vale a pena
dada a superioridade do projeto Natura. Visto que possibilita
projetos como o seu. :o)
Se você se precisa apenas das palavras já convertidas em pt-BR
(como o arquivo port.geral.dic), posso te enviar!
As palavras que adicionei estão arquivos separados.
[]s
Em 27/09/2009 16:12, Citando a mensagem de William Colen:
Acho que posso te ajudar nos próximos passos. Poderia me mandar o que
já foi feito?
Qual será a licença do dicionário pt-BR? Eu precisaria do dicionário
compatível com LGPL v. 3 para o verificador gramatical...
Obrigado,
William
2009/9/27 Jeferson Hultmann <hult...@gmail.com>:
http://natura.di.uminho.pt/svnweb/index.cgi/Natura/browse/dicionarios/jspell.pt/DOC/license
[]s
Em 27/09/2009 22:17, Citando a mensagem de William Colen:
--
At
[]s
Em 27/09/2009 22:59, Citando a mensagem de William Colen:
Pode ser os arquivos do hunspell sim, mas melhor no formato em que
você também está trabalhando, para poder fazer as coisas
colaborativamente.
O repositório de versões não está sendo usado mais?
Obrigado,
William
2009/9/28 Jeferson Hultmann <hult...@gmail.com>:
Os arquivos que edito são as listas de palavras da pasta
jspell.pt/DIC do svn natura. Não sei de estes são jspell. :-)
Eu tenho o hunspell pois desde janeiro uso estes arquivos no
Firefox e Thunderbird.
E O repositório CVS do mozdev não está atualizado.
[]s
Em 28/09/2009 21:42, Citando a mensagem de William Colen:
http://downloads.mozdev.org/br/ortografia.pt-br-dev.xpi
[]s
Em 28/09/2009 22:37, Citando a mensagem de William Colen:
Mas se você comentou pensando em colocar lá o arquivos hunspell,
então não é caso, no repo só ficam os fontes e hunspell é
"output". :-)
[]s
Em 29/09/2009 00:43, Citando a mensagem de Mario Felipe Rinaldi:
> jeferson, seria legal ter um servidor git ou mercurial??? :)
>
> 2009/9/29 Jeferson Hultmann <hult...@gmail.com <mailto:hult...@gmail.com>>
abraços,
William
2009/9/29 Jeferson Hultmann <hult...@gmail.com>:
Estes arquivos viram jspell (se é que já não são) e depois
myspell, hunspell etc.
Como você quer os arquivos para o corretor gramatical, acredito
que o hunspell seja o melhor, pois está tudo consolidado.
[]s
Em 29/09/2009 00:55, Citando a mensagem de William Colen:
[]s
Em 29/09/2009 14:29, Citando a mensagem de William Colen:
> Oi Jefferson,
>
> Conversei com o Rui Vilela, que trabalha no projeto Natura, e ele me
> contou que ao converter da sintaxe Jspell para a sintaxe Hunspell usando
> os scripts deles estamos perdendo dados:
>
> "... a etiquetação morfológica pode fugir um pouco ao que o hunspell
> define como padrão (baseada em Jspell). A parte relacionada com a
> sufixação de sufixos que gera as conjugações pronominais (-se, -lhe,
> -te, etc...) não foi convertida para o formato "2 fold affix" do
> hunspell. Ou seja, não deve estar a funcionar (nem tenho a certeza se
> funcionará) ..."
>
> Isto confirma que seria melhor trabalharmos no formato Jspell mesmo (que
> é o formato dos arquivos da pasta jspell.pt/DIC
> <http://natura.di.uminho.pt/svnweb/index.cgi/Natura/browse/dicionarios/jspell.pt/DIC>)
> até descobrirmos pelo menos como arrumar este problema relatado pelo Rui.
>
> Obrigado,
> William
>
>
>
> 2009/9/29 Jeferson Hultmann <hult...@gmail.com
> <mailto:hult...@gmail.com>>:
> >
> > Os arquivos que eu edito são os localizados no jspell.pt/DIC
> <http://jspell.pt/DIC> do svn natura.
> > Desculpe a confusão, pensei que tinha ficado claro aqui:
> > http://groups.google.com/group/dic-br/msg/3600b41bcdf1a067
> >
> > Estes arquivos viram jspell (se é que já não são) e depois myspell,
> hunspell
> > etc.
> >
> > Como você quer os arquivos para o corretor gramatical, acredito que o
> > hunspell seja o melhor, pois está tudo consolidado.
> >
> > []s
> >
> >
> > Em 29/09/2009 00:55, Citando a mensagem de William Colen:
> >>
> >> O Hunspell é output? Você está editando esses arquivos que você mandou
> >> ou são outros? Eu prefiro trabalhar com os de entrada.
> >> Já estou escrevendo alguns scripts aqui. Vou colocar num repositório
> >> do meu projeto. Quando tiver alguma coisa mando.
> >>
> >> abraços,
> >> William
> >>
> >>
> >>
> >> 2009/9/29 Jeferson Hultmann<hult...@gmail.com
> <mailto:hult...@gmail.com>>:
> >>>
> >>> O mozdev oferece mercurial, mas como é um repositório por projeto
> prefiro
> >>> ficar no CVS mesmo (atualizarei tão logo volte a mexer nisso).
> >>>
> >>> Mas se você comentou pensando em colocar lá o arquivos hunspell, então
> >>> não é
> >>> caso, no repo só ficam os fontes e hunspell é "output". :-)
> >>>
> >>> []s
> >>>
> >>> Em 29/09/2009 00:43, Citando a mensagem de Mario Felipe Rinaldi:
> >>>>
> >>>> jeferson, seria legal ter um servidor git ou mercurial??? :)
> >>>>
> >>>> 2009/9/29 Jeferson Hultmann<hult...@gmail.com
> <mailto:hult...@gmail.com>
> >>>> <mailto:hult...@gmail.com <mailto:hult...@gmail.com>>>