SSMLで<break>タグを入れると、その直後の単語の頭の文字が2回発音されるようになった。。

79 views
Skip to first unread message

Takamitsu Mizutori

unread,
Jun 11, 2018, 7:18:44 AM6/11/18
to Assistant Developer Community Japan
初めて投稿させていただきます。水鳥と申しますmm
SSMLで、メニューを読み上げる時などに<break>タグで”間”を入れていたのですが、
なぜか、今週から、<break>タグ直後の単語の頭文字が2回発音されるようになりました。
Assitantのエンジンがアップデートされたのか、原因は不明ですが、同じようなことが起きている方がいるか確認したく投稿させていただきました。
例えば、下のようなものを発話させますと、「う、うみ」、「や、やま」と、小さい声で余分に「う」と「や」が入ってしまいます。

<speak><break time=“0.5s”/>1<break time=“0.5s”/>海<break time=“0.5s”/>2<break time=“0.5s”/>山</speak>

Actions on Google Simulatorで添付のファイルのように、AUDIOタブに上のタグを入れて再生すると再現できます。
何か知っている方がいたら情報共有していただけると大変助かります!

スクリーンショット 2018-06-11 20.07.37.png

としえもん

unread,
Jun 11, 2018, 7:56:53 AM6/11/18
to Assistant Developer Community Japan
水島さん、こんばんは!
こういった「Assistant側(TTS)にバグがある」と思った場合(つまり、開発者側ではどうしようもできない)はサポートに直接連絡したほうがいいですよ。

今回の場合、具体的なSSMLのコードとmp3(Actions consoleからダウンロードできるはず)を添付したほうがサポートする側も動きやすいはずです。


2018年6月11日月曜日 20時18分44秒 UTC+9 Takamitsu Mizutori:

としえもん

unread,
Jun 11, 2018, 7:59:16 AM6/11/18
to Assistant Developer Community Japan
水鳥さんでしたね!
失礼しました。m(_ _)m

2018年6月11日月曜日 20時56分53秒 UTC+9 としえもん:

Yoichiro Tanaka

unread,
Jun 11, 2018, 8:57:43 AM6/11/18
to Assistant Developer Community Japan
こんばんは。洋一郎です。

例えば、下のようなものを発話させますと、「う、うみ」、「や、やま」と、小さい声で余分に「う」と「や」が入ってしまいます。
<speak><break time=“0.5s”/>1<break time=“0.5s”/>海<break time=“0.5s”/>2<break time=“0.5s”/>山</speak>

としえもんさんのおっしゃる通り、基本的にはGoogleアシスタント側のText to Speechでの問題かな、とは思います。
ただ、これが修正されるまで使えません、では困ってしまうので、いくつか試してみました。

結果としては、speak要素のテキストノードとしては、「う、うみ」になってしまいますが、何らかの要素で囲めば、
正しく発声してくれるようです。以下のように、p、p > s、prosody を使うと、「うみ」と正しく発声されました。

もしこれらが Workaround になれば、ひとまず回復するまではそれらで凌ぐ、ということはできそうです。

<speak>
 
<break time="0.5s"/>

  海
 
<break time="0.5s"/>

  山
 
<break time="0.5s"/>
 
<p></p>
 
<break time="0.5s"/>
 
<p></p>
 
<break time="0.5s"/>
 
<p><s></s></p>
 
<break time="0.5s"/>
 
<p><s></s></p>
 
<break time="0.5s"/>
 
<prosody rate="fast"></prosody>
 
<break time="0.5s"/>
 
<prosody rate="fast"></prosody>
</speak>

上記をActions simulator にて試してみてください。

ご参考になれば幸いです。ではでは。

-Yoichiro


2018年6月11日月曜日 20時59分16秒 UTC+9 としえもん:

Takamitsu Mizutori

unread,
Jun 13, 2018, 4:07:25 AM6/13/18
to Assistant Developer Community Japan
としえもんさん

確かに、その通りですね!
オフィシャルの方にもメールし、回答もらいました。
原因の解析をしてくれるみたいですが、<s></s>タグで囲って凌いでくれというワークアラウンドもアドバイスもらえました。

Takamitsu Mizutori

unread,
Jun 13, 2018, 4:10:16 AM6/13/18
to Assistant Developer Community Japan
洋一郎さん

アドバイスありがとうございます!こちらの方法で解決させていただきました。
Googleのサポートからも、返答があり、<s></s>タグで囲んでねということでした。
なぜ頭文字の発音が2回出てしまうのかは調査してもらえるようです。
Reply all
Reply to author
Forward
0 new messages