2

我正在使用 Google Speech 流 API 和 Google Text to Speech 创建一个语音机器人。我只想转录用户的语音,即使用户“打断”了语音机器人的响应。如何避免语音机器人转录自己的声音?

根据我在扬声器上使用现有语音机器人(如 Siri)的测试,“过滤”某些声音的能力似乎是可行的。

谢谢

4

1 回答 1

1

虽然 Google Speech API 中没有开箱即用的此类功能,但您可以尝试一些众所周知的算法。音频波是相加的,因此从自身减去音频流等于零(静音)。考虑到这一点并为您的语音机器人音频输出提供单独的流,一种方法是从用户的输入语音中减去语音机器人的语音。如果您无法访问任何一个音频流或无法将它们分开,另一种方法是应用扬声器分类从一个中提取两个语音源。

请注意,如果您对两个流进行简单的减法,您可能无法达到预期的效果,因为减法也会衰减音频。相反,您需要反转减去的流并将其与从中减去的流混合。

于 2019-08-01T00:31:44.123 回答