Reboot

2 views
Skip to first unread message

Jeferson Hultmann

unread,
Oct 20, 2008, 11:24:12 PM10/20/08
to dic...@googlegroups.com
hi all

Recomecei a atualização do dic. Peguei os arquivos atuais do SVN
no natura.di.uminho.pt e consegui compilar com sucesso os
arquivos hunspell (formato do fx3/tb3/etc).

Agora só vou parar quando estiver tudo concluído. Vai demorar
algumas semanas, espero que Fx3.1 saia só ano que vem. :-)

Como dito em mensagens anteriores, a licença mudou de GPL para
GPL/LGPL/MPL, de modo que será possível embutir o dic no source
mozilla pt-BR.

Aguarde mais detalhes nos próximos dias!

[]s

P.S. mudei o nome do grupo de "dic-br-bsd" para "dic-br".


fmguima

unread,
Oct 22, 2008, 5:30:39 PM10/22/08
to Dicionário pt-BR para verificação ortográfica
Jeferson,

Boas notícias!

Como posso ajudar? Não sou lá grande expert em "escovação de bits",
mas se me disser o que fazer, gostaria de colaborar. Veja se tem algum
jeito de incrementar / corrigir o dicionário "on-the-fly".

Abs,

Fernando Guimarães
21/10/08 19:30

Jeferson Hultmann

unread,
Oct 22, 2008, 9:23:38 PM10/22/08
to dic...@googlegroups.com
Estou atualizando meus scripts as páginas de revisão pt-PT ==>
pt-BR.

Nesta primeira fase a meta é revisar o arquivo principal de
34000 linhas, linha por linha. Remover as linhas com palavras
não freqüentes e adaptar a ortografia pt.

Eu já revisei 2000 linhas e removi 30% delas. Adaptei a
ortografia de algumas (tipo actor => ator).

Amanhã envio instruções a quem quiser colaborar!

Mas o você quer dizer com incrementar / corrigir o dicionário
"on-the-fly"? Já não tem a opção de adicionar a palavra?


[]s

Citando a mensagem de fmguima:

fmguima

unread,
Oct 23, 2008, 4:40:17 PM10/23/08
to Dicionário pt-BR para verificação ortográfica
O que eu quero dizer é se estas correções que fazemos no dicionário
particular podem ser replicadas no dicionário oficial, beneficiando os
outros usuários. Pelo que sei, o que se pode fazer não é mais do que
acrescentar palavras, não dá para corrigi-las.

Existem casos que a sugestão aparece separada em duas palavras.
Entendo que o que o dicionário está fazendo é reconhecendo duas
palavras que juntas se assemelham àquela que foi digitada: como
corrigir isto, ou como informar esta distorção?

Outra coisa é a conjugação de verbos e flexionamento de substantivos e
adjetivos (masculino, feminino, plural, aumentativo, diminutivo e seus
plurais, etc.).

Nossa língua é complicada pois é bem estruturada, por derivação do
latim. Isto lhe confere características que não se encontram em
línguas menos estruturadas ou com menos regras. Por isto não dá para
aplicar só as regras pobres da língua inglesa. Temos que implementar
ou desenvolver algo especial, mas que, penso eu, já está desenvolvido,
a exemplo outros pacotes. O que se pode aprender com estas outras
experiências?

Sem mais delongas, se quiser, mande um lote de palavras que eu reviso.

Abs,

Fernando Guimarães
23/10/08 18:40

hultmann

unread,
Oct 23, 2008, 10:27:45 PM10/23/08
to Dicionário pt-BR para verificação ortográfica
OK, tudo atualizado e pronto a quem quiser colaborar:
http://br.mozdev.org/projeto/ortografia/

[]s

Jeferson Hultmann

unread,
Oct 23, 2008, 10:31:37 PM10/23/08
to dic...@googlegroups.com
Citando a mensagem de fmguima:
> O que eu quero dizer é se estas correções que fazemos no dicionário
> particular podem ser replicadas no dicionário oficial, beneficiando os
> outros usuários. Pelo que sei, o que se pode fazer não é mais do que
> acrescentar palavras, não dá para corrigi-las.

Com certeza haverá meios de melhorar o dic, mas não on the fly.
Talvez uma página com form.


>
> Existem casos que a sugestão aparece separada em duas palavras.
> Entendo que o que o dicionário está fazendo é reconhecendo duas
> palavras que juntas se assemelham àquela que foi digitada: como
> corrigir isto, ou como informar esta distorção?

??? Pode dar um exemplo?

Se vc digitar "porisso" vai sugerir "por isso". Não é o desejável?


>
> Outra coisa é a conjugação de verbos e flexionamento de substantivos e
> adjetivos (masculino, feminino, plural, aumentativo, diminutivo e seus
> plurais, etc.).
>
> Nossa língua é complicada pois é bem estruturada, por derivação do
> latim. Isto lhe confere características que não se encontram em
> línguas menos estruturadas ou com menos regras. Por isto não dá para
> aplicar só as regras pobres da língua inglesa. Temos que implementar
> ou desenvolver algo especial, mas que, penso eu, já está desenvolvido,
> a exemplo outros pacotes. O que se pode aprender com estas outras
> experiências?

???² Qualquer dic em pt já implementa todas essas regras, não?
Que erros vc está encontrando?

[]s

Jeferson Hultmann

unread,
Oct 24, 2008, 7:18:53 PM10/24/08
to fmguima, dic...@googlegroups.com
OK, marquei os arquivos como seus.

Me ocorreu agora uma forma do usuário enviar palavras para o
projeto.

Modifico a extensão do dic pt-BR-dev e acrescento um item no menu:

Adicionar ao dicionário
Adicionar ao dicionário e enviar ao projeto <==

Meditarei sobre isso nas próximas semanas. :-)

[]s


Citando a mensagem de fmguima:

> Jeferson,
>
> Não tenho um exemplo de imediato. Quando acontecer reporto nesta
> lista.
>
> Para iniciar a colaboração na revisão do dic, fico com os primeiros
> 5.000 livres, que pelo site são as linhas 10.001 a 15.000. Me avise se
> alguém já pegou algumas destas e me incumba de outras.
>
> []s

Reply all
Reply to author
Forward
0 new messages