conv.ask(`<speak>こんにちは\nこんばんば</speak>`)
// output// こんにちは// こんばんば
conv.ask(`<speak>こんにちは\n<break time="0.5s"/>こんばんば</speak>`)
// output// こんにちは こんばんば
conv.ask(`<speak>こんにちは<break time="0.5s"/>\nこんばんば</speak>`)
// output// こんにちは こんばんば
高玉です。まだ現象を確認していないのですが、回避策を思いついたのでお知らせです。
https://developers.google.com/actions/assistant/responses#simple_response
の Sample code の Node.js にあるやり方で、speech と text を分けて書くのはいかがでしょうか?
app.intent('hoge', (conv) => {
conv.ask(new SimpleResponse({
speech: '<speak>こんにちは<break time="3s"/>こんばんば</speak>',
text: 'こんにちは\nこんばんば',
}))
})