Speech Recognition para Pt-Br

6,531 views
Skip to first unread message

Thiago Ferreira de Toledo

unread,
Feb 17, 2016, 7:50:18 AM2/17/16
to Python Brasil
Olá pessoal,

Estou com uma dúvida para configurar o speech recognition do Python para o português do Brasil (pt-Br).

A biblioteca do Python SpeechRecognition 3.2 <https://pypi.python.org/pypi/SpeechRecognition/> tem suporte apenas aos idiomas de inglês, chinês e francês. 

Então, minha dúvida é se alguém sabe alguma maneira de treinar o Python para reconhecer o pt-Br?


Atenciosamente,
Thiago

Mário Idival

unread,
Feb 17, 2016, 7:55:00 AM2/17/16
to python...@googlegroups.com

Mário Idival
Python Developer

Twitter|Github|Skype|Facebook: marioidival
User Linux : #554446

--
--
------------------------------------
Grupo Python-Brasil
http://www.python.org.br/wiki/AntesDePerguntar
 
<*> Para visitar o site do grupo na web, acesse:
http://groups.google.com/group/python-brasil
 
<*> Para sair deste grupo, envie um e-mail para:
python-brasi...@googlegroups.com

---
Você recebeu essa mensagem porque está inscrito no grupo "Python Brasil" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para python-brasi...@googlegroups.com.
Para mais opções, acesse https://groups.google.com/d/optout.

firebits

unread,
Feb 17, 2016, 8:02:02 AM2/17/16
to python...@googlegroups.com, Mauro Risonho de Paula Assumpção, Mauro Risonho de Paula Assumpção

Pode parecer loucura, o que vou dizer, mas há outros idiomas e pelo jeito dá para "criar" novos idiomas, conforme o fragmento do texto abaixo:

https://pypi.python.org/pypi/SpeechRecognition/

Installing other languages

By default, SpeechRecognition’s Sphinx functionality supports only US English. Additional language packs are also available, but not included due to the files being too large:

Creio que com colaboração, ou até crowdfunding, pode-se criar algo para português-Brasil.

Se der certo, seria muito bem vindo, principalmente para muitas pessoas!:)

Só foi uma idéia!:)

@firebitsbr

@firebitsbr


--

firebits

unread,
Feb 17, 2016, 8:04:51 AM2/17/16
to python...@googlegroups.com, Mauro Risonho de Paula Assumpção, Mauro Risonho de Paula Assumpção
Não tinha visto, o email do Mário Idival!

@MárioIdival
Ótima iniciativa!

@firebitsbr

Thiago Ferreira de Toledo

unread,
Feb 17, 2016, 1:16:15 PM2/17/16
to Python Brasil
Obrigado pelo retorno pessoal,

Então Mário, eu não gostaria de usar a API do Google com o Python. Estou procurando uma outra maneira para treinar um sistema de Speech Recognition. 

Gostaria de fazer algo no estilo do que o Firebits comentou. Que seria algo no sentido de criar um treinamento para o SpeechRecognition do Python, pois sei que essa biblioteca permite tem integração com Google API, IBM, AT&T e Wit.ai.

Se alguém souber de uma outra sugetão, serei grato!

Abraços,
Thiago

Sergio Garcia

unread,
Feb 17, 2016, 2:02:56 PM2/17/16
to python...@googlegroups.com
Talvez de para usar os dados do [Fala Brasil][1] no treinamento e seguir os passos indicados no pacote [SpeechRecognition][2].



--

Thiago Ferreira de Toledo

unread,
Feb 18, 2016, 5:10:29 AM2/18/16
to Python Brasil
Olá,

É uma boa alternativa. Obrigado pela sugestão Sergio.

Abraços,
Thiago

Renato Barbosa

unread,
Feb 1, 2017, 9:54:09 AM2/1/17
to Python Brasil
Olá Thiago, tudo bem?
Você teve sucesso no desenvolvimento deste modelo acustico em PT-BR para o python.

Estou iniciando estudos para criar isso, uso a API do Google porém desejo ter algo off-line como sphinix permite.

Abraço.

Código Logo

unread,
Jun 7, 2017, 3:49:37 PM6/7/17
to Python Brasil
Olá eu vim parar aqui graças ao google, eu tenho um projeto para a construção de um modelo para pt-br. No momento preciso de dados de voz, um boa corpora. Pretendo fazer o projeto para a comunidade python.

Mauricio

unread,
Jun 8, 2017, 1:39:11 PM6/8/17
to Python Brasil, mrpa.s...@gmail.com, mauro....@gmail.com
Isso é ótimo, obrigado

Código Logo

unread,
Jun 22, 2017, 7:10:11 AM6/22/17
to Python Brasil, mrpa.s...@gmail.com, mauro....@gmail.com
Espero que a comunidade também tenha interesse, já tenho o meu ambiente pronto, só falta a corpora. Será que alguém tá afim de ajudar ou há alguma maneira de conseguir umas 100 horas de aúdio com transcrição?

Dayllon Chavier

unread,
Jul 23, 2017, 8:33:46 PM7/23/17
to Python Brasil, thiag...@gmail.com
Eu sou iniciante em programação e precisava muito de fazer entrada de voz em python 2. Algo que quando uma pessoa falar, transforme essa fala em uma string. O mais próximo que encontrei para resolver esse problema foi a biblioteca speech recognition, porém ela não tem para português, e como meus conhecimentos não são muito profundos não entendi muito bem esse API com o google, que pelo que entendi, resolveria meu problema. Será que alguém pode me ajudar?

Thiago Ferreira de Toledo

unread,
Jul 24, 2017, 3:05:56 PM7/24/17
to Python Brasil, thiag...@gmail.com

Olá,


Cara, você pode usar a API do Google: Web Speech API, que é um código Javascript. Outra opção é você utilizar a API do Python, que possui o reconhecimento de fala. Acesse o Google Cloud para pegar essa API. 


Tanto o Web Speech API quanto a API em Python do Google possuem reconhecimento para o pt-br.


Qualquer dúvida avise.


Abs,

Thiago

Message has been deleted

Thiago Ferreira de Toledo

unread,
Jul 24, 2017, 3:19:28 PM7/24/17
to Python Brasil
Olá Renato,

Desculpe a demora. Estive ausente deste grupo.

Mudei o foco do projeto e utilizei APIs prontas para o pt-br. No caso, eu integrei o Google Web Speech API e o Microsoft Bing Speech API em meu projeto Web.

Abs,
Thiago

Dayllon Chavier

unread,
Aug 12, 2017, 9:41:04 AM8/12/17
to Python Brasil, thiag...@gmail.com
Olá,

Cara não faço ideia de como pegar essa API do python. Pode me passar mais instrucões por favor?

Thiago Ferreira de Toledo

unread,
Aug 12, 2017, 10:33:38 AM8/12/17
to Python Brasil, thiag...@gmail.com
Olá Dayllon,


E para mais instruções da API, veja esse: https://dvcs.w3.org/hg/speech-api/raw-file/tip/webspeechapi.html

Qualquer outra dúvida, avise.

[]s,
Thiago
Reply all
Reply to author
Forward
0 new messages