音声認識APIで応答"response":が　同じ音源でも入ったり入らなかったりする。

55 views

Skip to first unread message

すやま

unread,

Dec 18, 2018, 8:50:08 PM12/18/18

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

こんにちわ　度々すいません。

PCM, 16kHz, 16bit, 1chの音源file (filesize:445,120byte / duration:13.91")

で音声認識APIをLinux上のCURLコマンドでテストしているのですが、

（音源は試験の為、-20dB程度のBGMをかぶせています）

上記同じ音源を、間隔をあけて、数回、音声認識のテストをしたところ、

１回目応答：〇　※結果はjqコマンドで整形しています

{
"response": [
    {
      "result": "この|コノ|この|連体詞||||"
    },
    ......
],
"status": "recog-finished",
"session_id": "175ec5f4-032d-11e9-8b8e-42010a920032",
"type": "asr#nictlvcsr"
}

２回目応答：×

{
"response": [],
"status": "recog-finished",
"session_id": "27cc70bc-032d-11e9-8f00-42010a920032",
"type": "asr#nictlvcsr"
}

と２回目は responseの中身が空でした。

statusは正常に "recog-finished" となっています。

１０回行ったところ　「〇×〇×〇×〇〇〇×」

と４回は responseは空 [ ] で返ってきました。

（各テストの間隔は数秒空けています）

それぞれの音声認識APIのコールのトークンは毎回取り直しています。

コマンドは

curl -X POST \
    -H "Content-Type: audio/x-pcm;bit=16;rate=16000;channels=1" \
    -H "x-mimi-process:nict-asr" \
    -H "x-mimi-input-language:ja" \
    -H "Authorization: Bearer ${TOKEN}" \
    --data-binary @${FILE} \
    -L https://sandbox-sr.mimi.fd.ai/ | jq .

です。

何故このようになり、どうすれば良いでしょうか？

以上　よろしくお願いいたします。

吉川哲史

unread,

Feb 2, 2019, 12:51:12 AM2/2/19

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

本件、返信が滞っており申し訳ございません。

該当事象については、サーバ内部でタイムアウトしているなど可能性は考えられますが、

これという原因まではお答えできないのが現状です。

コンテスト期間中に調査・回答差し上げることはお約束できないのですが、

もし差し支えなければ、今後のサービス改善に役立てるため、

該当の音声ファイルをいただくことは可能でしょうか。

＃個人情報が内容に含まれる音声だとかで、弊社が自由に使用すると問題ありそうな場合は、

　断っていただければと思います。

＃また、OKの場合、弊社でファイルのアップローダを用意することは難しいため、

　オンラインのファイル転送サービスを使用するか、

　私 yosh...@fairydevices.jp 宛にメール添付でご送付くださればと思います。

音声認識APIで応答"response":が 同じ音源でも入ったり入らなかったりする。

すやま

吉川哲史

音声認識APIで応答"response":が　同じ音源でも入ったり入らなかったりする。