音声認識APIで応答"response":が 同じ音源でも入ったり入らなかったりする。

55 views
Skip to first unread message

すやま

unread,
Dec 18, 2018, 8:50:08 PM12/18/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
こんにちわ 度々すいません。

PCM, 16kHz, 16bit, 1chの音源file (filesize:445,120byte / duration:13.91")
で音声認識APIをLinux上のCURLコマンドでテストしているのですが、
(音源は試験の為、-20dB程度のBGMをかぶせています)
上記同じ音源を、間隔をあけて、数回、音声認識のテストをしたところ、

1回目応答:〇 ※結果はjqコマンドで整形しています
{
  "response": [
    {
      "result": "この|コノ|この|連体詞||||"
    },
    ......
  ],
  "status": "recog-finished",
  "session_id": "175ec5f4-032d-11e9-8b8e-42010a920032",
  "type": "asr#nictlvcsr"
}

2回目応答:×
{
  "response": [],
  "status": "recog-finished",
  "session_id": "27cc70bc-032d-11e9-8f00-42010a920032",
  "type": "asr#nictlvcsr"
}

と2回目は responseの中身が空でした。

statusは正常に "recog-finished" となっています。
10回行ったところ 「〇×〇×〇×〇〇〇×」
と4回は responseは空 [ ] で返ってきました。
(各テストの間隔は数秒空けています)

それぞれの音声認識APIのコールのトークンは毎回取り直しています。

コマンドは
curl -X POST \
    -H "Content-Type: audio/x-pcm;bit=16;rate=16000;channels=1" \
    -H "x-mimi-process:nict-asr" \
    -H "x-mimi-input-language:ja" \
    -H "Authorization: Bearer ${TOKEN}" \
    --data-binary @${FILE} \
    -L https://sandbox-sr.mimi.fd.ai/ | jq .

です。
何故このようになり、どうすれば良いでしょうか?

以上 よろしくお願いいたします。



吉川哲史

unread,
Feb 2, 2019, 12:51:12 AM2/2/19
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
本件、返信が滞っており申し訳ございません。
該当事象については、サーバ内部でタイムアウトしているなど可能性は考えられますが、
これという原因まではお答えできないのが現状です。

コンテスト期間中に調査・回答差し上げることはお約束できないのですが、
もし差し支えなければ、今後のサービス改善に役立てるため、
該当の音声ファイルをいただくことは可能でしょうか。

#個人情報が内容に含まれる音声だとかで、弊社が自由に使用すると問題ありそうな場合は、
 断っていただければと思います。

#また、OKの場合、弊社でファイルのアップローダを用意することは難しいため、
 オンラインのファイル転送サービスを使用するか、
 私 yosh...@fairydevices.jp 宛にメール添付でご送付くださればと思います。
 (数百KB程度のサイズであれば)

Reply all
Reply to author
Forward
0 new messages