Julius + LaPSAM - Reduzir erro no reconhecimento de voz

195 views
Skip to first unread message

Claudiomar Araújo

unread,
Feb 18, 2016, 8:52:32 AM2/18/16
to coruja...@googlegroups.com
Como reduzir a taxa de erro (WER) no reconhecimento de voz ?

No Ubuntu 14.04.3 LTS 64 bits, estou utilizando os modelos acústicos e de linguagem coruja_jlapsapi para reconhecimento de voz em tempo real com entradas a partir de um microfone. Estive testando diversos parâmetros mas a taxa de erro ainda é alta, principalmente para frases, mesmo que simples.

Fiz o seguinte:
  • Instalei as dependências
    • ~$ sudo apt-get install build-essential zlib1g-dev flex 
    • ~$ sudo apt-get install libasound2-dev libesd0-dev libsndfile1-dev
  • Baixei Julius versão atual julius-4.3.1.tar.gz e extraí
  • Em .../julius-4.3.1/
    • Extraí os modelos acústicos e de linguagem LaPSAM 1.5 x64
    • Executei os comandos:
      • ./configure
      • make clean
      • make
      • sudo make install
    • Em .../julius-4.3.1/coruja_jlapsapi/
      • Executei o comando abaixo para iniciar a aplicação conforme os parâmetros especificados no arquivo .jconf
        • $ julius -C julius.jconf -input mic -d ./LaPSLM1.5.lm.bin -h ./LaPSAM1.5.am.bin -hlist ./LaPSAM1.5.tiedlist -v ./dic.temp -force_ccd
        • Neste diretório estão todos os arquivos especificados nos argumentos do comando acima

Caso essas informações não sejam suficientes, estou à disposição para responder eventuais dúvidas.

--
Claudiomar Araújo

Thiago Ferreira de Toledo

unread,
Feb 18, 2016, 11:46:58 AM2/18/16
to Coruja - Reconhecimento de Voz em PB
Olá Claudiomar,

Nos meus testes também obtive erros elevados.

Como você testou no Ubuntu, pode me dizer se o processamento foi demorado? Pois testei no Windows 10 - 64 bits, e a cada frase que eu falava no microfone, demorava em torno de uns 5 segundos para processar e transcrever toda a frase. Isso ocorreu com você?

Atenciosamente,
Thiago

Thiago Ferreira de Toledo

unread,
Feb 18, 2016, 1:12:19 PM2/18/16
to Coruja - Reconhecimento de Voz em PB
Corrigindo...

Instalei o Coruja no Windows 8.1 - 32 bits! Utilizando o Visual Studio 2015.

No Windows de 64 bits não cosnegui fazer funcionar.

Cassio Batista

unread,
Feb 18, 2016, 4:11:47 PM2/18/16
to coruja...@googlegroups.com
Olá Claudiomar,

Se o vocabulário das frases não for muito grande, você pode utilizar uma gramática no lugar do LaPSLM.
A construção e utilização estão descritas na página oficial do Julius: http://julius.osdn.jp/en_index.php?q=en_grammar.html

Att.

--
--
FalaBrasil Speech Group - http://www.laps.ufpa.br/falabrasil
Você recebeu esta mensagem porque está inscrito no Grupo "Coruja -
Reconhecimento de Voz em PB" nos Grupos do Google.
Para postar neste grupo, envie um e-mail para
coruja...@googlegroups.com
Para cancelar a sua inscrição neste grupo, envie um e-mail para
coruja-users...@googlegroups.com
Para ver mais opções, visite este grupo em
http://groups.google.com/group/coruja-users?hl=pt-BR?hl=pt-BR

---
Você recebeu essa mensagem porque está inscrito no grupo "Coruja - Reconhecimento de Voz em PB" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para coruja-users...@googlegroups.com.
Para mais opções, acesse https://groups.google.com/d/optout.



--
Cassio Batista

Graduando em Engenharia da Computação
Universidade Federal do Pará

claudiom...@lavid.ufpb.br

unread,
Feb 19, 2016, 9:54:02 AM2/19/16
to Coruja - Reconhecimento de Voz em PB
Thiago,
O retorno leva menos de 1 segundo, mesmo para grandes frases.

Cassio,
Boa sugestão! Mas preciso que sejam reconhecidas diversas palavras pt-br. 


Obrigado!
Att,
Reply all
Reply to author
Forward
0 new messages