1

我正在https://console.actions.google.com/的网络视图上为 Google 助理构建自定义操作

其中一个响应是一个很长的提示句,由以下内容组成:

  • 通俗易懂的“请寄信至”

然后

  • 难以理解的地址(英国邮政编码中的字母和数字,如“XX12 1XX”,以及听起来模棱两可的街道名称)

然后

  • 通俗易懂的“请……询问……”

这一切都在给定场景的欢迎提示的 yaml 中定义:

    candidates:
      - first_simple:
        variants:
          - speech: |-
              Please ... where the address is ... ... and please ... enquiry ...

有没有办法微调这个“演讲”?或者有没有一种方法可以让谷歌助手在中间以较慢的速度说出这个恒定的文本?

4

1 回答 1

2

是的,您可以使用SSML来发回回复,而不是使用更简单的文本到语音模型转换的文本。

此 SSML 可以包含一个韵律标签,其中包含您发送的部分内容的速率属性,因此它会更慢地说该部分。

所以它可能看起来像

    candidates:
      - first_simple:
        variants:
          - speech: |-
              <speak>Please ... where the address is <prosody rate="30%"> ... ...</prosody> and please ... enquiry ...</speak>

您可能还希望查看say-as 标记以拼出地址中的字符。SSML 中的特定部分可能看起来像

   <say-as interpret-as="characters">XX12 1XX</say-as> somewhere street
于 2020-09-05T23:32:21.027 回答