Treinamento Modelo Acústico usando script disponibilizado no site FalaBrasil

126 views
Skip to first unread message

Marcos Valadão

unread,
Dec 15, 2015, 5:26:21 PM12/15/15
to Coruja - Reconhecimento de Voz em PB
Olás,
Primeiramente parabéns aos idealizadores do projeto e aqueles que fazem parte. Sensacional!

Questionamento:
Estou com uma dúvida sobre o script de treinamento de modelo acústico disponibilizados na página de vocês. 
Estou com uma base de dados para treinamento do modelo, contendo o arquivos wav fragmentados e a transcrição de cada um deles em outros arquivos. No README encontrado junto ao conjunto de scrips do treinamento não esta disponibilizado a forma como se usa os scripts somente o objetivo de cada um. Dei uma olha no arquivo Inicial.sh e ele parece não fazer nada somente copiar os arquivos passados nos parâmetros 

#!/bin/bash
CORPUS
=/diretorio/corpus/
TRAIN
="lista de treino"
TEST
="lista de teste"
TXT
="lista de arquivos txts"


echo
Criando listas de treino e teste ...


# copia lista de arquivos (treino e teste)
cp $TRAIN
.
cp $TEST
.
cp $TXT
.


echo

Gostaria de saber se existe algum passo a passo para realizar o treinamento a partir destes scripts que pudessem disponibilizar para este fim levando em conto que já possuo a lista de arquivos wav de treino de teste e a lista de transcritos txt...
Ainda, se não for possível a orientação a partir deste script, existe outro meio para treinamento do modelo acústico a partir destes dados que falei possuir?

Motivação:
Faço parte de um grupo de pesquisa na Universidade Federal de Juiz de Fora (UFJF) que utiliza o Coruja para a transcrição de video-aulas e usa deste transcrito para relacionar estas a partir de tags identificando o assunto abordado nela. 
Estamos focado na parte de aperfeiçoamento dos resultados para que o transcrito tenha um nível de acerto ainda maior e possibilite assim uma melhor recuperação de informações.
Deixo aberto para dicas de aperfeiçoamento do resultados.
Já temos algumas ideias, se alguém se interessar seria ótimo compartilha-las para que nos ajudem e mais ideias apareçam para o projeto Coruja

att,

Nelson Neto

unread,
Dec 16, 2015, 6:23:29 AM12/16/15
to coruja...@googlegroups.com
Olá Marcos.

Obrigado pelas palavras.

A ordem de execução é exatamente a que aparece no README, inicia com a preparação dos dados e finaliza com o testes de reconhecimento. Um tutorial completo encontras no capítulo 3 do HTK Book:


Bom trabalho.


Att.

-- Nelson.


--
--
FalaBrasil Speech Group - http://www.laps.ufpa.br/falabrasil
Você recebeu esta mensagem porque está inscrito no Grupo "Coruja -
Reconhecimento de Voz em PB" nos Grupos do Google.
Para postar neste grupo, envie um e-mail para
coruja...@googlegroups.com
Para cancelar a sua inscrição neste grupo, envie um e-mail para
coruja-users...@googlegroups.com
Para ver mais opções, visite este grupo em
http://groups.google.com/group/coruja-users?hl=pt-BR?hl=pt-BR

---
Você recebeu essa mensagem porque está inscrito no grupo "Coruja - Reconhecimento de Voz em PB" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para coruja-users...@googlegroups.com.
Para mais opções, acesse https://groups.google.com/d/optout.

Cassio Batista

unread,
Dec 16, 2015, 11:42:30 AM12/16/15
to coruja...@googlegroups.com
Marcos,

Tem um tutorial na página do projeto VoxForge também:
http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial

Ele mostra o processo de treino de um modelo acústico para a língua inglesa com o HTK, similar ao contido nos scripts que falaste.
O tutorial também dá um overview das ferramentas e uma breve explicação sobre cada passo.

Att.
Message has been deleted

Marcos Valadão

unread,
Dec 16, 2015, 12:00:41 PM12/16/15
to Coruja - Reconhecimento de Voz em PB
Obrigado Nelson e Cassio
Qualquer dúvida volto a postar aqui.

att,
Marcos Valadão

Marcos Valadão

unread,
Feb 15, 2016, 2:08:58 PM2/15/16
to Coruja - Reconhecimento de Voz em PB
Olá pessoal,
Usei o script de treinamento para fazer um treino de teste de um modelo acústico. 
Fiquei um pouco na dúvida sobre como integrar este novo modelo a api do Coruja usando o Julius. 
Pelo o  que eu entendi a ultima pasta a ser gerada foi "hmmTree" e o modelo seria o arquivo dentro dela "hmmdefs" além do arq "tiedlist" gerado.
Estes são os arquivos da criação do novo modelo. Tentei fazer alguns teste substituindo estes arquivos nos arquivos do modelo criado pelos integrantes do projeto da api do Coruja, estou correto?
Qual seria a melhor forma de testar o novo modelo treinado??

abs,
Marcos Valadão
Reply all
Reply to author
Forward
0 new messages