google의 음성인식/TTS(Text-to-speech) API

466 views
Skip to first unread message

Jaeho Lee

unread,
Oct 7, 2013, 1:39:39 AM10/7/13
to appso...@googlegroups.com
https://gist.github.com/alotaiba/1730160

이것도 역시 필기 인식처럼 가능하군요.
flac 파일을 POST로 업로드 하는 식으로 가능합니다. 왜 하필 flac 인지는 좀 갸우뚱 하네요.


현재 chrome 에선 html 에서도 음성인식을 사용할 수 있는데 speex를 쓸 수 있다고 해서 혹 했으나 수정버전이라고 하니 확인해봐야겠습니다.
as3에서도 speex 코덱을 사용해서 녹음 할 수 있는데 호환이 되면 flac 변환을 위해 SoX 라이브러리에 의지하지 않고 바로 쓸 수 있거든요.

http://bbs.9ria.com/thread-181256-1-1.html 중국것도 있는데 이건 speex인가봅니다. content-type을 "audio/x-speex-with-header-byte;rate=16000" 이렇게 쓰는 시도인데
작동여부는 알 수 없습니다.

TTS 는 단순하네요.
http://translate.google.com/translate_tts?tl=en&q=Not%20enough%20mineral 이런 식으로 부르면 아예 mp3를 뱉아주네요.
반면 사용제약이 있어서 구글 쪽은 유료고 다른 쪽을 살표봐야겠습니다.

Reply all
Reply to author
Forward
0 new messages