我想知道Python 上的 Microsoft Speech API 是否支持多种语音识别。我看到了 SDK Speaker Recognition 的测试版,但我想知道这个功能是否已经在 Speech SDK 中。
如果有人需要/尝试过使用 MS Speec 在语音到文本中进行多种语音识别,我已经检查了所有 python SDK 方法文档并在 web 和 stackoverflow 上进行了搜索,但我找不到任何相关信息。
当我使用 Microsoft Speech-to-Text 转录两人对话(女性和男性)的音频时,当语音发生变化时,识别的文本不会被分割。