音声認識APIの応答データ(json)の項目について

51 views
Skip to first unread message

su...@unixon.co.jp

unread,
Dec 17, 2018, 11:43:10 PM12/17/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
こんにちは、
音声認識APIを httpのREST-APIで呼び出した場合の応答ですが、
ドキュメント
には、
{ "response" : [ { "pronunciation" : "ローニャク", "result" : "老若", "time" : [ 300, 810 ] }, { "pronunciation" : "ナンニョ", "result" : "男女", "time" : [ 810, 1180 ] }, ...
の様な応答で、 「time」という項目がありますが、
x-mimi-process:nict-asr
x-mimi-input-language:ja
で呼び出したところ、
{"type": "asr#nictlvcsr", "session_id": "f0aab59a-027c-11e9-bb00-42010a920032", "status": "recog-finished", "response": [{"result": "福岡|フクオカ|福岡|名詞-固有名詞|||地域-一般|"},{"result": "市|シ|市|名詞-接尾-地域||||"},{"result": "で|デ|で|助詞-格助詞-一般||||"}, ...
という応答で、「time」という項目がありませんでした。

これは、nict-asrを指定した場合、「time」情報は取得できないということなのでしょうか
また、「time」情報を取得する方法はあるのでしょうか

何卒よろしくお願いいたします



吉川哲史

unread,
Dec 18, 2018, 12:31:58 AM12/18/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
ご質問ありがとうございます。
nict-asr では time 情報は取得する方法はございません。

すやま

unread,
Dec 18, 2018, 1:20:03 AM12/18/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
ご回答ありがとうございます。
nict-asrでは、timeが取れない件、承知いたしました。

HTTP(REST)ではなく、WebSocketでも同様にtimeは取れないのでしょうか?

吉川哲史

unread,
Dec 18, 2018, 1:26:01 AM12/18/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
はい、HTTPでもWebSocketでもレスポンスの形式は同じです。

すやま

unread,
Dec 18, 2018, 1:44:27 AM12/18/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム
回答ありがとうございます

WebSocketの場合、音源発生の時間軸で、適度なチャンクサイズに分けて socketに送信
していくのだと思いますが、その場合、音声認識結果の応答の文字列は、どのタイムコードのものかは
わからないということでしょうか?

吉川哲史

unread,
Dec 18, 2018, 4:24:51 AM12/18/18
to 多言語音声翻訳サンドボックスサーバー技術フォーラム

その場合、音声認識結果の応答の文字列は、どのタイムコードのものかは
わからないということでしょうか?

はい、わかりません。 
Reply all
Reply to author
Forward
0 new messages