Apresentando-me

5 views
Skip to first unread message

Leonardo Fontenelle

unread,
Jul 24, 2007, 5:43:45 AM7/24/07
to dic-b...@googlegroups.com
Meu nome é Leonardo Ferreira Fontenelle, sou tradutor de software
livre (principalmente do GNOME) e mantenedor dos dicionários de
português brasileiro para aspell e vimspell, o que é uma forma pomposa
de dizer que reempacoto o trabalho do Verificador Ortográfico do
BrOffice.org.

Há pouco tempo descobri por acaso esse projeto do br.mozdev.org, e
fiquei curioso. Nas minhas conversas com Rui Vilela (do Projeto
Natura), ele chegou a me perguntar como o Brasil fazia com o
dicionário para Firefox e companhia, e eu supus que se reempacotava o
Verificador Ortográfico. Pelas minhas conversas com Raimundo Moura, do
BrOffice.org, ele também não sabia do projeto.

Acho a idéia de adaptar o dicionário do Natura para o português do
Brasil muito interessante -- na verdade, quem primeiro a fez foi
Ricardo Ueda, antigo mantenedor do dicionário br.ispell, por sugestão
de Arnaldo Mandel. O trabalho não foi concluído, suponho que por ser
muito longo, mas não tenho certeza. Já tentei contactar Ricardo Ueda
algumas vezes, inclusive via seu antigo sysadmin, sem sucesso.

Pessoalmente, se eu fosse gerenciar um dicionário eu faria como o
Projeto Natura e como Ricardo Ueda, agrupando as palavras. Também
gostei da idéia de usar um sistema de controle de versões para
gerenciar a lista de palavras, como faz o Projeto Natura.

Por favor, eu gostaria de saber do andamento desse projeto de
adaptação do dicionário do Projeto Natura para o português do Brasil:
ritmo, resultado alcançado até agora, número de participantes, fluxo
de trabalho, relação com o dicionário incluído atualmente do FF etc.

Leonardo Fontenelle
http://leonardof.org/2007/06/30/entrevista-com-rui-vilela-mantenedor-do-dicionario-de-portugues-europeu/pt/
http://leonardof.org/2007/06/13/lexico-%e2%80%9cdicionario%e2%80%9d-de-portugues-do-brasil-para-aspell-e-vim/pt/
http://br-linux.org/linux/atualizacao-do-lexico-de-portugues-do-brasil-para-gnu-aspell
http://leonardof.org/2007/05/26/harry-potter-e-a-verificacao-ortografica/pt/

Jeferson Hultmann

unread,
Jul 25, 2007, 12:26:42 AM7/25/07
to dic-b...@googlegroups.com
olá Leonardo, excelente ver você por aqui. :-)

O Rui Vilela está inclusive inscrito nesta lista, embora como
apenas web.

Embora seja trabalhoso, acredito que vale a pena "converter"
este dic. É um projeto fantástico. Aproveitamos os
aprimoramentos feitos pela equipe pt-PT e a partir de um
código-fonte temos os mais variados formatos.

O trabalho estava parado desde o começo do ano. Agora com o
Mario ajudando, espero deslanchar. Até então eu era o único
colaborador. :-)

Método de trabalho, como ajudar, arquivos:
http://br.mozdev.org/projeto/ortografia/

Há uma extensão do Firefox lá na página que irei atualizar a
medida que formos avançado (usa o sistema de atualização de
extensões).

O dic que está no addons é o Ricardo Ueda (também já tentei
contatá-lo). Consegui, mas ele sumiu depois.

Leonardo Fontenelle disse:

Leonardo Fontenelle

unread,
Jul 25, 2007, 5:53:04 AM7/25/07
to dic-b...@googlegroups.com
Esse dicionário poderia ser usado pelo BrOffice.org também... Acho que
seria interessante conversar com o Raimundo a possibilidade de unir os
esforços. Infelizmente ele está acostumado a um modo de trabalho bem
diferente[1], e não sei se vai querer embarcar no projeto.

Não sei programar, mas talvez antes de revisar o resto do dicionário
pt_PT pudéssemos convertê-lo à ortografia brasileira. O Ricardo fez
isso no sentido inverso (gerou um dicionário pt_PT a partir de um
pt_BR), então talvez possa ajudar.

Outra idéia, agora para os verbos: sua verificação poderia ser
dividida em duas etapas, a da conjugação e a da ortografia da raiz.
Assim acredito que ficaria mais eficiente; talvez pudéssemos usar o
Verificador Ortográfico do BrOffice.org para uma "cola", já que a
estrutura da conjugação verbal já está pronta lá.

Leonardo Fontenelle
http://leonardof.org

1. http://www.openoffice.org.br/node/418

Em 25/07/07, Jeferson Hultmann<hult...@gmail.com> escreveu:

Jeferson Hultmann

unread,
Jul 25, 2007, 7:15:53 PM7/25/07
to dic-b...@googlegroups.com
Leonardo Fontenelle disse:
> Esse dicion�rio poderia ser usado pelo BrOffice.org tamb�m... Acho que

> seria interessante conversar com o Raimundo a possibilidade de unir os
> esfor�os. Infelizmente ele est� acostumado a um modo de trabalho bem
> diferente[1], e n�o sei se vai querer embarcar no projeto.

Isto já é entre ele e o Projecto Natura. :-)


>
> N�o sei programar, mas talvez antes de revisar o resto do dicion�rio
> pt_PT pud�ssemos convert�-lo � ortografia brasileira. O Ricardo fez
> isso no sentido inverso (gerou um dicion�rio pt_PT a partir de um
> pt_BR), ent�o talvez possa ajudar.

??? Que diferença você vê entre revisar o dicionário e converter
para pt-BR? É isso que estamos fazendo no momento. "1ª fase -
Revisão das palavras pt-PT"


>
> Outra id�ia, agora para os verbos: sua verifica��o poderia ser
> dividida em duas etapas, a da conjuga��o e a da ortografia da raiz.
> Assim acredito que ficaria mais eficiente; talvez pud�ssemos usar o
> Verificador Ortogr�fico do BrOffice.org para uma "cola", j� que a
> estrutura da conjuga��o verbal j� est� pronta l�.

???[2] Não entendi o que você quer dizer. Qual o problema com o
algoritmo de conjugação atual? :-?

Leonardo Fontenelle

unread,
Jul 25, 2007, 7:31:29 PM7/25/07
to dic-b...@googlegroups.com
Em 25/07/07, Jeferson Hultmann<hult...@gmail.com> escreveu:
> ??? Que diferença você vê entre revisar o dicionário e converter
> para pt-BR? É isso que estamos fazendo no momento. "1ª fase -
> Revisão das palavras pt-PT"

Minha idéia é tentar converter automaticamente "facto" para "fato" e
por aí em diante, para depois revisarmos com nossos próprios
neurônios. É mais fácil olhar e dizer "ok" que olhar e corrigir :)

> ???[2] Não entendi o que você quer dizer. Qual o problema com o
> algoritmo de conjugação atual? :-?

O que você quer dizer com "algoritmo atual"? Se for o do Projeto
Natura, ele precisaria ser conferido para ver se coincide com a
ortografia brasileira. Se isso já estiver feito, ótimo! Se não,
poderíamos conferi-lo e adaptá-lo, ou então usar o do VO, que já está
pronto.

Leonardo Fontenelle
http://leonardof.org

Jeferson Hultmann

unread,
Jul 25, 2007, 7:47:59 PM7/25/07
to dic-b...@googlegroups.com
Leonardo Fontenelle disse:

> Em 25/07/07, Jeferson Hultmann<hult...@gmail.com> escreveu:
>> ??? Que diferença você vê entre revisar o dicionário e converter
>> para pt-BR? É isso que estamos fazendo no momento. "1ª fase -
>> Revisão das palavras pt-PT"
>
> Minha idéia é tentar converter automaticamente "facto" para "fato" e
> por aí em diante, para depois revisarmos com nossos próprios
> neurônios. É mais fácil olhar e dizer "ok" que olhar e corrigir :)


eu já revisei alguns arquivos e são tão poucas palavras a
corrigir que esse esforço de programação não vale a pena (pelo
menos de minha parte).

o mais comum é simplesmente remover palavras. veja aqui
<http://www.mozdev.org/source/browse/br/dicionarios/review/port.geral.00001-00250.dic.txt.diff?r1=1.1&r2=1.2&f=h>

as com * serão apagadas.

>
>> ???[2] Não entendi o que você quer dizer. Qual o problema com o
>> algoritmo de conjugação atual? :-?
>
> O que você quer dizer com "algoritmo atual"? Se for o do Projeto
> Natura, ele precisaria ser conferido para ver se coincide com a
> ortografia brasileira. Se isso já estiver feito, ótimo! Se não,
> poderíamos conferi-lo e adaptá-lo, ou então usar o do VO, que já está
> pronto.
>

algoritmo atual: o dic precisa de um algoritmo para saber que
"saberia" é derivado de "saber". :-)

não tenho conhecimento de nenhuma diferença de conjugação
pt-PT/pt-BR. Se houver, isso pode ser feito depois da revisão.
Não é o enfoque agora.

Você pretende participar do processo de revisão? Eu dividi em
137 arquivos de 250 linhas. Já revisei 4. :-P

Jeferson Hultmann

unread,
Jul 25, 2007, 8:23:50 PM7/25/07
to dic-b...@googlegroups.com
Jeferson Hultmann disse:

>> Minha idéia é tentar converter automaticamente "facto" para "fato" e
>> por aí em diante, para depois revisarmos com nossos próprios
>> neurônios. É mais fácil olhar e dizer "ok" que olhar e corrigir :)
>
>
> eu já revisei alguns arquivos e são tão poucas palavras a corrigir que
> esse esforço de programação não vale a pena (pelo menos de minha parte).
>

outro ponto a ser observado nessa abordagem é que pode
configurar trabalho derivado. Um caso parecido seria eu usar as
traduções do gnome para traduzir o Firefox automaticamente (tipo
o recurso translation memory). Eu estaria violando a licença GPL
do gnome. :-)

Leonardo Fontenelle

unread,
Jul 26, 2007, 5:30:28 AM7/26/07
to dic-b...@googlegroups.com
Acho que incorporar a tradução do GNOME numa memória de tradução não
seria problema, já que as traduções aproximadas são só sugestões da
máquina, quem traduz é o homem.

http://leonardof.org

Em 25/07/07, Jeferson Hultmann<hult...@gmail.com> escreveu:
>

Leonardo Fontenelle

unread,
Jul 26, 2007, 5:36:29 AM7/26/07
to dic-b...@googlegroups.com
Se você diz que uma varredura prévia por software não seria de muita
ajuda, tenho que acreditar :) Rui Vilela me passou uma versão
"candidata a lançamento" do pt_* para Aspell 5 (sendo o componente
pt_BR do BrOffice.org) e avisou sobre algumas questões, incluindo
maiúsculas iniciais; darei uma olhada nisso durante o final de semana,
e então avisarei se de alguma forma redunda em sugestões para a
adaptação do dicionário do projeto Natura para o português do Brasil.

Eu acho que existe alguma diferença na conjugação verbal, mas não sei
dizer precisamente. Mais uma vez, vai ter que ficar para o final de
semana.

Infelizmente, não tenho previsão de poder ajudar com a revisão. Talvez
eu ainda passe a colaborar com a tarefa, mas hoje em dia seria
inconseqüência da minha parte.

Leonardo Fontenelle
http://leonardof.org

Jeferson Hultmann

unread,
Jul 26, 2007, 10:07:26 PM7/26/07
to dic-b...@googlegroups.com
Leonardo Fontenelle disse:
> Se voc� diz que uma varredura pr�via por software n�o seria de muita
> ajuda, tenho que acreditar :) Rui Vilela me passou uma vers�o
> "candidata a lan�amento" do pt_* para Aspell 5 (sendo o componente
> pt_BR do BrOffice.org) e avisou sobre algumas quest�es, incluindo
> mai�sculas iniciais; darei uma olhada nisso durante o final de semana,
> e ent�o avisarei se de alguma forma redunda em sugest�es para a
> adapta��o do dicion�rio do projeto Natura para o portugu�s do Brasil.

aspell eu nem tentei compilar. por enquanto limito-me ao myspell
(que de um trabalhão pra rodar direitinho no ubuntu :-). (no
futuro espero conseguir produzir todos os formatos do pt-PT.)

Mas não entendi sobre aspell 5 com o broffice. não seria hunspell?


>
> Eu acho que existe alguma diferen�a na conjuga��o verbal, mas n�o sei


> dizer precisamente. Mais uma vez, vai ter que ficar para o final de
> semana.

é só usar o dic (em adaptação) no cotidiano:
http://br.mozdev.org/projeto/ortografia/ Caso ache algum verbo
mal conjugado... Estou fazendo isso há meses e por enquanto tudo OK.


>
> Infelizmente, n�o tenho previs�o de poder ajudar com a revis�o. Talvez


> eu ainda passe a colaborar com a tarefa, mas hoje em dia seria

> inconseq��ncia da minha parte.
>

oh não! :-)

Jeferson Hultmann

unread,
Jul 26, 2007, 10:13:24 PM7/26/07
to dic-b...@googlegroups.com
Configura trabalho derivado, é a palavra oficial do moz.org.
Isso ficou claro numa discussão sobre o http://open-tran.eu/

Leonardo Fontenelle disse:
> Acho que incorporar a tradu��o do GNOME numa mem�ria de tradu��o n�o
> seria problema, j� que as tradu��es aproximadas s�o s� sugest�es da
> m�quina, quem traduz � o homem.


>
> http://leonardof.org
>
> Em 25/07/07, Jeferson Hultmann<hult...@gmail.com> escreveu:
>> Jeferson Hultmann disse:

>>>> Minha id�ia � tentar converter automaticamente "facto" para "fato" e
>>>> por a� em diante, para depois revisarmos com nossos pr�prios
>>>> neur�nios. � mais f�cil olhar e dizer "ok" que olhar e corrigir :)
>>>
>>> eu j� revisei alguns arquivos e s�o t�o poucas palavras a corrigir que
>>> esse esfor�o de programa��o n�o vale a pena (pelo menos de minha parte).
>>>
>> outro ponto a ser observado nessa abordagem � que pode


>> configurar trabalho derivado. Um caso parecido seria eu usar as

>> tradu��es do gnome para traduzir o Firefox automaticamente (tipo
>> o recurso translation memory). Eu estaria violando a licen�a GPL
>> do gnome. :-)


Leonardo Fontenelle

unread,
Jul 29, 2007, 10:19:17 PM7/29/07
to dic-b...@googlegroups.com, Rui Vilela
O BrOffice.org usa o hunspell. Mais especificamente, o dicionário do
BOo é myspell, ou seja, não precisa das extensões criadas pelo
hunspell. Eu "traduzo" para aspell e vimspell, para que os usuários
destes verificadores tenham acesso a um dicionário mais atualizado que
o do Ueda.

Eu e (principalmente) Rui Vilela estamos trabalhando numa atualização
do Aspell5-pt, que precisa incluir as variações PT e BR no mesmo
pacote (isso não acontece mais no Aspell6). A grande maioria das
palavras do pt_PT (oriundas do Projeto Natura) são comuns ao
Verificador Ortográfico (do BOo); será que poderíamos admiti-las
automaticamente, para nos concentrarmos nas demais?

Quanto à conjugação verbal, parece existirem raras divergências entre
Brasil e Portugal (www.linguateca.pt/documentos/conjug.pdf). Rui
Vilela, você está a par de algum outro recurso para adaptar o
dicionário do Projeto Natura para a conjugação verbal brasileira?

Leonardo Fontenelle
http://leonardof.org

Reply all
Reply to author
Forward
0 new messages