使用 WaveNet 语音时使用 ssml 时无法生成不同的音频波。
<prosody rate="slow" pitch="-2st">Can you hear me now?</prosody>
<prosody rate="medium" pitch="1st">Can you hear me now?</prosody>
<prosody rate="high" pitch="5st">Can you hear me now?</prosody>
使用强调标签会产生相同的结果。
我们正在使用来自 Google Cloud Text-to-Speech 的 Python API 来请求音频生成。
我想在每个样本中听到不同的声音强度。
请注意,我们也尝试对 " 进行缩放,但它对生成的音频没有影响。