如果我将一小段 SSML 发送到语音处理器,我会得到两个声音
<speak version='1.0' xml:lang='es-ES'>
<voice xml:lang='es-ES' xml:gender='Male' name='Microsoft Server Speech Text to Speech Voice (es-ES, Pablo, Apollo)'>
<p>
<s>Hola </s>
<s xml:lang='en'>Hello</s>
<s>¿Cómo estas?.</s>
</p>
</voice>
</speak>
一个说西班牙语的男人和一个说英语的女人。这是 Project Oxford Text to Speech 引擎的限制吗?换句话说,我希望同一个声音会说几种语言,但看起来情况并非如此。