将 SSML 中的韵律标签与 Google Cloud TTS 一起使用时,我无法调整单个单词的属性而不会造成不必要的停顿。
下面的代码在“新”和“视频”之间创建了一个延迟。有人建议后处理器可以删除这些暂停,但我想知道是否有办法直接在代码本身内执行它?
<speak>
Hello, and welcome to this<prosody pitch="+3st">New</prosody>Video Tutorial.
</speak>
将 SSML 中的韵律标签与 Google Cloud TTS 一起使用时,我无法调整单个单词的属性而不会造成不必要的停顿。
下面的代码在“新”和“视频”之间创建了一个延迟。有人建议后处理器可以删除这些暂停,但我想知道是否有办法直接在代码本身内执行它?
<speak>
Hello, and welcome to this<prosody pitch="+3st">New</prosody>Video Tutorial.
</speak>
我没有最明确的答案,因为您的要求不是很受支持。Prosody 的音高轮廓让您可以改变句子不同部分的语调。
韵律轮廓示例
<speak><prosody contour="(0%, +20Hz) (20%, +30%) (100%, +20%)"> Hello friends! </prosody></speak>
我仍在玩这个,但这似乎是一种乏味的方式来完成你想做的事情。
使用轮廓
轮廓采用一串元组“(句子中的%位置,音高调整)(...,...)
我希望这对您的工作有所帮助并祝您好运!
经过测试,似乎没有办法使用 Google Cloud TTS 执行此操作。您可以在生成声音文件后手动编辑它,但这会破坏练习的目标。