ストリーミングでの音声認識における文節区切り挿入について

71 views
Skip to first unread message

aytn...@gmail.com

unread,
Jan 23, 2020, 7:55:33 AM1/23/20
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
javascriptでストリミング方式で音声認識をさせて無音区間を検知して強制的に文節の区切りを入れたいと思っておりますが、そのようなコマンドはないのでしょうか。
現在は「recog-break」を送り一旦ソケットを閉じて再度ソケットを開いていますがタイムラグがあるので、そのようなコマンドがあればとお伺いしているところです。どうぞよろしくお願いいたします。

吉川哲史

unread,
Jan 24, 2020, 4:03:37 AM1/24/20
to 多言語音声翻訳サンドボックスサーバー技術フォーラム, aytn...@gmail.com
ご質問ありがとうございます。
サンドボックスサーバーの音声認識APIの機能自体に、音声を区切る機能はございません。
本APIは、発話単位ごとに区切られた音声でデータ送信いただくことを想定しているためで、
その場合、クライアント側(この場合、JavaScript側)で発話区間の検出を行っていただく必要があります。

「発話区間検出」「音声区間検出」「VAD」などのキーワードで検索していただくと、
JavaScript用のライブラリがいくつか見つかりますので、
それらの利用をご検討いただければと思います。

aytn...@gmail.com

unread,
Jan 24, 2020, 6:44:34 AM1/24/20
to 多言語音声翻訳サンドボックスサーバー技術フォーラム, aytn...@gmail.com
ご回答いただきましてありがとうございました。


2020年1月23日木曜日 21時55分33秒 UTC+9 aytn...@gmail.com:
Reply all
Reply to author
Forward
0 new messages