1

在我的 SSML 响应中,如果我添加一个重点,而不是额外的文本,则音频结果是错误的:

<speak>
    <p>To make a search, say: <emphasis>help</emphasis>.</p>
    <p>To make a search, say: "<emphasis>help</emphasis>".</p>
    <p>To make a search, say: "<emphasis>help</emphasis>" and I will help you.</p>
</speak>

在这个示例中,对于第一个句子,助手在句子末尾说“点”,在第二个句子中,它说“引号”。最后一个没问题。

有什么帮助解决这个问题吗?

弗雷德里克

4

1 回答 1

1

中间有emphasis标签,音频被分成三个部分。句子的前后部分被分成单独的部分并呈现为单独的输出。

<p>To make a search, say: <emphasis>help</emphasis>.</p>变为:“要进行搜索,请说:”、“帮助”、“。”

这就是它渲染点的原因,因为没有单词,所以它认为唯一的文本是句号。

您可以将点放在emphasis标签内以删除该工件。

<p>To make a search, say: <emphasis>help.</emphasis></p>

于 2018-04-16T16:48:15.560 回答