音声認識可能な音声の長さ

61 views
Skip to first unread message

sakuda-...@gr.sei.co.jp

unread,
Dec 2, 2018, 11:24:33 PM12/2/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
「サーバーのAPIを直接実行する」方式で音声認識のリクエストを行った際、
日本語でおよそ20秒、英語でおよそ10秒以上のファイルを送信した場合に、
音声認識結果が返されませんでした
※短いファイルの場合は問題なく音声認識できています。

音声認識できる音声の長さ(≒ファイルサイズ)に制限があるのでしょうか

■リクエスト
  curl -X POST \
  -H "Content-Type: audio/x-pcm;bit=16;rate=16000;channels=1" \
  -H "x-mimi-process:nict-asr" -H "x-mimi-input-language:ja" \
  -H "Authorization: Bearer アクセストークン" \
  --data-binary @ファイル名
  -L https://service.mimi.fd.ai

■レスポンス
 {"type": "asr#nictlvcsr", "session_id": "セッションID", "status": "recog-finished", "response": []}

吉川哲史

unread,
Dec 3, 2018, 2:33:26 AM12/3/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
お問い合わせありがとうございます。

制約がある箇所としてはサーバでの認識処理時間にタイムアウトがございますので、
長時間の音声や雑音の多い音声に対してエラー応答が返却されることがございます。
発話に一区切りがついたタイミングで、区切って音声認識にかけていただくことをおすすめします。

また、入力音声のサンプリングレートやチャンネル数が正しい(=Content-Typeで指定している内容と、
実際のファイルが合っている)ことも合わせてご確認いただければと思います。



2018年12月3日月曜日 13時24分33秒 UTC+9 TS:

TS

unread,
Dec 3, 2018, 7:28:05 PM12/3/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
内容承知しました。
ご回答ありがとうございました。
Reply all
Reply to author
Forward
0 new messages