speech-recognition - 过滤掉某些语音 Google Speech API

Question

我正在使用 Google Speech 流 API 和 Google Text to Speech 创建一个语音机器人。我只想转录用户的语音，即使用户“打断”了语音机器人的响应。如何避免语音机器人转录自己的声音？

根据我在扬声器上使用现有语音机器人（如 Siri）的测试，“过滤”某些声音的能力似乎是可行的。

谢谢

score 1 · Accepted Answer

虽然 Google Speech API 中没有开箱即用的此类功能，但您可以尝试一些众所周知的算法。音频波是相加的，因此从自身减去音频流等于零（静音）。考虑到这一点并为您的语音机器人音频输出提供单独的流，一种方法是从用户的输入语音中减去语音机器人的语音。如果您无法访问任何一个音频流或无法将它们分开，另一种方法是应用扬声器分类从一个中提取两个语音源。

请注意，如果您对两个流进行简单的减法，您可能无法达到预期的效果，因为减法也会衰减音频。相反，您需要反转减去的流并将其与从中减去的流混合。

speech-recognition - 过滤掉某些语音 Google Speech API

1 回答 1

Related

Reference