音声認識APIの応答データ(json)の項目について

su...@unixon.co.jp

unread,

Dec 17, 2018, 11:43:10 PM12/17/18

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

こんにちは、

音声認識APIを httpのREST-APIで呼び出した場合の応答ですが、

ドキュメント

https://mimi.readme.io/v1.0.1/docs/http-service

には、

{ "response" : [ { "pronunciation" : "ローニャク", "result" : "老若", "time" : [ 300, 810 ] }, { "pronunciation" : "ナンニョ", "result" : "男女", "time" : [ 810, 1180 ] }, ...

の様な応答で、「time」という項目がありますが、

x-mimi-process:nict-asr

x-mimi-input-language:ja

URLは、https://sandbox-sr.mimi.fd.ai/

で呼び出したところ、

{"type": "asr#nictlvcsr", "session_id": "f0aab59a-027c-11e9-bb00-42010a920032", "status": "recog-finished", "response": [{"result": "福岡|フクオカ|福岡|名詞-固有名詞|||地域-一般|"},{"result": "市|シ|市|名詞-接尾-地域||||"},{"result": "で|デ|で|助詞-格助詞-一般||||"}, ...

という応答で、「time」という項目がありませんでした。

これは、nict-asrを指定した場合、「time」情報は取得できないということなのでしょうか

また、「time」情報を取得する方法はあるのでしょうか

何卒よろしくお願いいたします

吉川哲史

unread,

Dec 18, 2018, 12:31:58 AM12/18/18

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

ご質問ありがとうございます。

nict-asr では time 情報は取得する方法はございません。

すやま

unread,

Dec 18, 2018, 1:20:03 AM12/18/18

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

ご回答ありがとうございます。

nict-asrでは、timeが取れない件、承知いたしました。

HTTP(REST)ではなく、WebSocketでも同様にtimeは取れないのでしょうか？

吉川哲史

unread,

Dec 18, 2018, 1:26:01 AM12/18/18

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

はい、HTTPでもWebSocketでもレスポンスの形式は同じです。

すやま

unread,

Dec 18, 2018, 1:44:27 AM12/18/18

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

回答ありがとうございます

WebSocketの場合、音源発生の時間軸で、適度なチャンクサイズに分けて socketに送信

していくのだと思いますが、その場合、音声認識結果の応答の文字列は、どのタイムコードのものかは

わからないということでしょうか？

吉川哲史

unread,

Dec 18, 2018, 4:24:51 AM12/18/18

to 多言語音声翻訳サンドボックスサーバー技術フォーラム

その場合、音声認識結果の応答の文字列は、どのタイムコードのものかは
わからないということでしょうか？

はい、わかりません。

Reply all

Reply to author

Forward