3

如果我将一小段 SSML 发送到语音处理器,我会得到两个声音

<speak version='1.0' xml:lang='es-ES'>
  <voice xml:lang='es-ES' xml:gender='Male' name='Microsoft Server Speech Text to Speech Voice (es-ES, Pablo, Apollo)'>
    <p>
        <s>Hola </s>
        <s xml:lang='en'>Hello</s>
        <s>¿Cómo estas?.</s>
    </p>
  </voice>
</speak>

一个说西班牙语的男人和一个说英语的女人。这是 Project Oxford Text to Speech 引擎的限制吗?换句话说,我希望同一个声音会说几种语言,但看起来情况并非如此。

4

1 回答 1

1

引用 SSML规范

指定 xml:lang 并不意味着语音的变化,尽管这可能确实会发生。当给定的语音不能以所指示的语言说出内容时,处理器可以选择新的语音。

虽然当前的回退行为仍有待改进,但建议是创建多个语音节点并在切换语言时更明确地选择语音。

于 2016-10-04T16:06:50.917 回答