Text to Speech の文字数制限

419 views
Skip to first unread message

survival creative

unread,
Sep 30, 2020, 9:30:07 PM9/30/20
to Assistant Developer Community Japan
永岡と申します。Node.js + MongoDB + Heroku にて開発を行っています。
Integrations が必要なため、ESエージェントを使い続けています。

長文のテキストを読み上げてくれないようです。文字数の制限はありますか? 

割り当てと上限 

には「1 リクエストあたり最大 60 秒の音声」とあり、この上限に達したのかと思いますが、上限を上げる方法がわかりませんでした。

長文読み上げの実装として、テキストを分割して、複数回
conv.ask()
を行う方法は可能でしょうか。

あるいは、テキストを分割して、最初のテキストをユーザーに送ってから、ユーザーの「続きを聞く」のアクションの後、続きのテキストを送る方法も考えました。

ご助言いただければ幸いです。

Masaya Nagaoka

Yui Takeuchi

unread,
Oct 1, 2020, 3:27:27 AM10/1/20
to survival creative, Assistant Developer Community Japan
こんにちは!私が分かる範囲での回答になってしまうのですが...

長文のテキストを読み上げてくれないようです。文字数の制限はありますか? 

割り当てと上限 

テキスト レスポンスの最大文字数 4,000 文字

とあるので、文字数としては 4,000文字が上限のようです。


長文読み上げの実装として、テキストを分割して、複数回
conv.ask()
を行う方法は可能でしょうか。

複数回、conv.ask() を呼ぶことはできると思うのですが、結局レスポンスとしては文字列が連結されて1レスポンスとなるので、
上限の回避にはならないかと思います。

あるいは、テキストを分割して、最初のテキストをユーザーに送ってから、ユーザーの「続きを聞く」のアクションの後、続きのテキストを送る方法も考えました。

こちらの方法なら、システムとしてもユーザーへの体験としても問題なさそうですね。

otter - Yui Takeuchi

--
このメールは Google グループのグループ「Assistant Developer Community Japan」に登録しているユーザーに送られています。
このグループから退会し、グループからのメールの配信を停止するには assistant-developer-com...@googlegroups.com にメールを送信してください。
このディスカッションをウェブ上で閲覧するには https://groups.google.com/d/msgid/assistant-developer-community-japan/797f54f9-dafa-42bf-9c6b-7d5bfa6a4db5n%40googlegroups.com にアクセスしてください。

Yoichiro Tanaka

unread,
Oct 1, 2020, 4:01:06 AM10/1/20
to Assistant Developer Community Japan
こんにちは。洋一郎です。

> には「1 リクエストあたり最大 60 秒の音声」とあり、この上限に達したのかと思いますが、上限を上げる方法がわかりませんでした。

おそらく「1 リクエストあたり最大 60 秒の音声」に関しては、残念ながら上限を引き上げる申請の対象外ではないかと思います。

ご参考になれば幸いです。ではでは。

-Yoichiro


2020年10月1日木曜日 10:30:07 UTC+9 creat...@gmail.com:

survival creative

unread,
Oct 1, 2020, 4:25:05 AM10/1/20
to Assistant Developer Community Japan

ありがとうございます。洋一郎様。

丁寧なご回答、よくわかりました。テキストを分割して、ユーザーに「続きを聞く」のアクションを要求する実装で進めます。
本来は長時間の読み上げは好ましくなく、4000文字以内で伝えるべき、と思います。しかし元のテキストが定まっており、致し方なくこのような実装になりました。

今まで孤独に開発しておりましたが、お話しできる場所ができて嬉しく思っています。これからもよろしくお願いいたします。

永岡
2020年10月1日木曜日 17:01:06 UTC+9 yoichi...@gmail.com:

survival creative

unread,
Oct 1, 2020, 4:25:05 AM10/1/20
to Assistant Developer Community Japan
追記)
Yui Takeuchi 様にもお礼申し上げます。可愛いアイコンですねー。これからもよろしくお願いいたします。

永岡

2020年10月1日木曜日 17:01:06 UTC+9 yoichi...@gmail.com:
こんにちは。洋一郎です。

Yoichiro Tanaka

unread,
Oct 1, 2020, 4:28:31 AM10/1/20
to Assistant Developer Community Japan
すみません、大嘘をついたかもしれません。

GCP Consoleにて、対象のプロジェクトを開くと、IAMと管理、というメニューがあります。
この中に「割り当て」という項目があります。そこで、Dialogflowとフィルタに入力すると、
Dialogflowの各項目に関する現在の上限値と現状が表示されるかと思います。

その中からご希望の項目について、割り当て値の上限を引き上げる申請を行うことができます
ので、探してみてください。

-Yoichiro

2020年10月1日木曜日 17:25:05 UTC+9 creat...@gmail.com:

survival creative

unread,
Oct 1, 2020, 4:54:42 AM10/1/20
to Assistant Developer Community Japan

Youichiro 様

情報ありがとうございます。

snap_1797.png

早速、Console を確認しましたが、テキスト レスポンスの最大文字数 = Maximum text response length の項目は見つかりませんでした。英語がダメなので探せていないだけかもしれません。
この中の
「Standard Edition characters count of text-to-speech queryies 1分あたり」
10,000
に設定されており、4000文字との関連は不明です。この項目を上げると、もしかすると最大文字数も変わるでしょうか?

度々すみません。

永岡

2020年10月1日木曜日 17:28:31 UTC+9 yoichi...@gmail.com:

Yoichiro Tanaka

unread,
Oct 1, 2020, 6:01:55 AM10/1/20
to Assistant Developer Community Japan
> Standard Edition characters count of text-to-speech queryies 1分あたり

おそらくこれは queries、つまり問い合わせ数の上限となるので、文字数に対する項目ではないかなと思います。

-Yoichiro

2020年10月1日木曜日 17:54:42 UTC+9 creat...@gmail.com:

survival creative

unread,
Oct 1, 2020, 6:41:13 AM10/1/20
to Assistant Developer Community Japan

Youichiro様

やはりそうでしたか。ありがとうございます。予定通りの実装を試みてみます。

永岡
2020年10月1日木曜日 19:01:55 UTC+9 yoichi...@gmail.com:
Reply all
Reply to author
Forward
0 new messages