问题标签 [ssml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1343 浏览

text-to-speech - 有没有办法将语音直接转换为 SSML?

就像一个人能够使用各种语音到文本的“听写”工具将口语转换成相应的文本一样,我想知道是否有类似的工具可以将口语转换成相应的 SSML。也就是说,除了与说话者声音中存在的任何语调、韵律、停顿/中断、变形等相关的 SSML 标签之外,它还将提供文本。

0 投票
1 回答
51 浏览

alexa - 在 SSML 音频中使用“alexa”这个词

我已经实现了播放短 SSML 音频剪辑的技能。

但是,一些音频剪辑中包含 Alexa 短语建议。

其中一个剪辑包含短语“alexa stop”。

令我惊讶的是,在这种情况下,当技能退出而不是遵循预期的工作流程时,Alexa 似乎在“倾听”自己。

对此我能做些什么吗?

0 投票
0 回答
648 浏览

android - Android TTS 默认引擎支持哪些 SSML 标签

我搜索了很多无法找到任何可靠的解决方案,它们是 Android TTS 默认引擎支持的有效 ssml 标签。任何人都可以请更新我。

这些标签是否支持所有安卓设备。

0 投票
1 回答
53 浏览

ssml - SSML 韵律音高属性中百分比变化的含义是什么?

SSML 韵律元素可以采用表示相对变化的值,该值可以是百分比值(例如+50% 或-30%)。

那应该是多少百分比?它是当前音高的 Hz 值吗(因此八度音程(即 +12st)与 +100% 相同)?还是它与其他东西有关,例如 x-low 和 x-high 之间的范围(所以 x-low +50% 与 medium 相同,然后另一个 +50% 是 x-high)?是否只是由实施者决定?

我知道 SSML 不是用于标记音乐的系统,它代表“基线音高”或话语,而不是整个话语的准确音高。我只是想知道某些表达式是否可以被认为是等价的。

0 投票
1 回答
692 浏览

dialogflow-es - 您可以在 Dialogflow 中全局实施 SSML 吗?

有没有办法在 Dialogflow 代理中为您的所有意图实现 SSML 元素?更具体地说,我想在全球范围内添加 108% 的韵律率,但我不想通过 5 页的意图和后续意图手动将标签添加到每个响应中。感谢任何能提供帮助的人。

0 投票
2 回答
434 浏览

node.js - 对谷歌 SSML 的操作不起作用

谷歌node.js上的SSML不起作用。它只是将值与SSML tag一起告知。

示例: <speak> Hello <break time="1s"/> All </speak> 它只是告诉标签“小于说大于你好小于休息时间等于.......”

0 投票
1 回答
786 浏览

aws-lambda - 如何在自定义技能中更改 Alexa 特定单词的发音?

有时,在开发 Alexa 技能并对我的服务的响应进行编程时,Alexa 会误读我回复中的一个单词,从而使用户感到困惑。

例如,如果我想让 Alexa 说出一个单词,让它成为live ,我如何告诉 Alexa 如何正确发音该单词,因为live存在两个发音。

有没有办法向 Alexa 指示正确的发音,或者用正确的自定义声音替换它?我是否需要使用额外的标记或 API 调用?

0 投票
2 回答
1331 浏览

actions-on-google - Google Actions 是否支持 SSML?

我可以在此页面上看到 Actions on Google 确实支持 SSML,但是我无法让它在我的代理中工作。

我将 DialogFlow 与 PHP webhook 一起使用。

为了测试它,我的 webhook 通过 'speech' 参数提供以下响应:

在我的三星 S8 上通过 Google Assistant 进行测试,它以男性声音朗读(这是我的 Action in Actions on Google 的设置)。中断不显示在文本中,并且被语音引擎忽略。韵律标签出现在文本中,也被语音引擎忽略。

在 Google 音频模拟器上的 Actions 中尝试相同的输出确实可以正确解释 SSML 标签。

我是在做一些明显错误的事情,还是这些标签可能不受支持?

0 投票
1 回答
532 浏览

json - 我在使用 python 编写的 webhook 中的 SSML 在 DialogFlow(api.ai) 中播放音频时遇到问题

在我的 python webhook 中,我将 JSON 响应返回为-

但是,我从“显示 JSON”在 DialogFlow 中得到的是 -

在这里,响应没有 SSML 密钥。此外,如果我从程序中删除“语音”键,我会在 Google 助手测试应用程序中收到此错误,MalformedResponse expected_inputs[0].input_prompt.rich_initial_prompt.items[0].simple_response: 'text_to_speech' or 'ssml' must be放。

请帮忙!

回答

做到了

0 投票
0 回答
512 浏览

actions-on-google - Actions of Google 无法正确播放 SSML 强调并将其视为段落

我发现当我发回带有<emphasis>句子内部的响应时,Google 的 Actions 将其视为一个新段落并打破了句子。

例如:

这是呈现的 mp3

这个错误可以在TTS Simulator. 或由官方node.js SDK作为响应发送

我在这里添加了 2 句话并<p>强调差异。但是,实际上,这里没有必要。如果没有这些标签,问题可能会被复制。

根据SSML 标准 <emphasis>,可以在句子的中间。

另外的。我在 Amazon Alexa 上尝试过相同的标签,但它并不认为它是一个新产品线。

PS:

更多 Google Actions 打破了语音文本的呈现,并在<emphasis>. 但这是小问题——因为我可以通过 displayText 修复它。破碎的言语在这里更重要。