Julius + LaPSAM - Reduzir erro no reconhecimento de voz

Claudiomar Araújo

unread,

Feb 18, 2016, 8:52:32 AM2/18/16

to coruja...@googlegroups.com

Como reduzir a taxa de erro (WER) no reconhecimento de voz ?

No Ubuntu 14.04.3 LTS 64 bits, estou utilizando os modelos acústicos e de linguagem coruja_jlapsapi para reconhecimento de voz em tempo real com entradas a partir de um microfone. Estive testando diversos parâmetros mas a taxa de erro ainda é alta, principalmente para frases, mesmo que simples.

Fiz o seguinte:

Instalei as dependências

~$ sudo apt-get install build-essential zlib1g-dev flex
~$ sudo apt-get install libasound2-dev libesd0-dev libsndfile1-dev

Baixei Julius versão atual julius-4.3.1.tar.gz e extraí
Em .../julius-4.3.1/

Extraí os modelos acústicos e de linguagem LaPSAM 1.5 x64
Executei os comandos:

./configure
make clean
make
sudo make install

Em .../julius-4.3.1/coruja_jlapsapi/

Executei o comando abaixo para iniciar a aplicação conforme os parâmetros especificados no arquivo .jconf

$ julius -C julius.jconf -input mic -d ./LaPSLM1.5.lm.bin -h ./LaPSAM1.5.am.bin -hlist ./LaPSAM1.5.tiedlist -v ./dic.temp -force_ccd
Neste diretório estão todos os arquivos especificados nos argumentos do comando acima

Caso essas informações não sejam suficientes, estou à disposição para responder eventuais dúvidas.

--

Claudiomar Araújo

Thiago Ferreira de Toledo

unread,

Feb 18, 2016, 11:46:58 AM2/18/16

to Coruja - Reconhecimento de Voz em PB

Olá Claudiomar,

Nos meus testes também obtive erros elevados.

Como você testou no Ubuntu, pode me dizer se o processamento foi demorado? Pois testei no Windows 10 - 64 bits, e a cada frase que eu falava no microfone, demorava em torno de uns 5 segundos para processar e transcrever toda a frase. Isso ocorreu com você?

Atenciosamente,

Thiago

Thiago Ferreira de Toledo

unread,

Feb 18, 2016, 1:12:19 PM2/18/16

to Coruja - Reconhecimento de Voz em PB

Corrigindo...

Instalei o Coruja no Windows 8.1 - 32 bits! Utilizando o Visual Studio 2015.

No Windows de 64 bits não cosnegui fazer funcionar.

Cassio Batista

unread,

Feb 18, 2016, 4:11:47 PM2/18/16

to coruja...@googlegroups.com

Olá Claudiomar,

Se o vocabulário das frases não for muito grande, você pode utilizar uma gramática no lugar do LaPSLM.

A construção e utilização estão descritas na página oficial do Julius: http://julius.osdn.jp/en_index.php?q=en_grammar.html

Att.

--
--
FalaBrasil Speech Group - http://www.laps.ufpa.br/falabrasil
Você recebeu esta mensagem porque está inscrito no Grupo "Coruja -
Reconhecimento de Voz em PB" nos Grupos do Google.
Para postar neste grupo, envie um e-mail para
coruja...@googlegroups.com
Para cancelar a sua inscrição neste grupo, envie um e-mail para
coruja-users...@googlegroups.com
Para ver mais opções, visite este grupo em
http://groups.google.com/group/coruja-users?hl=pt-BR?hl=pt-BR

---
Você recebeu essa mensagem porque está inscrito no grupo "Coruja - Reconhecimento de Voz em PB" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para coruja-users...@googlegroups.com.
Para mais opções, acesse https://groups.google.com/d/optout.

--

Cassio Batista

Graduando em Engenharia da Computação

Universidade Federal do Pará

claudiom...@lavid.ufpb.br

unread,

Feb 19, 2016, 9:54:02 AM2/19/16

to Coruja - Reconhecimento de Voz em PB

Thiago,

O retorno leva menos de 1 segundo, mesmo para grandes frases.

Cassio,

Boa sugestão! Mas preciso que sejam reconhecidas diversas palavras pt-br.

Obrigado!

Att,

Reply all

Reply to author

Forward