我正在构建一个 android 应用程序,其中 TTS(文本到语音)由语音命令控制。对于语音识别,我使用的是 pocketsphinx,它在 TTS 未激活时工作正常(即“开始”命令)。但是,当 TTS 处于活动状态时(例如,对于“停止”命令),识别的准确性会下降。
我尝试使用 AcousticEchoCanceler,但似乎没有帮助。你能告诉我:
AEC 是否应该从输入中过滤手机输出?是它不能很好地工作还是它不应该这样做?
我还要尝试什么?
谢谢!
我正在构建一个 android 应用程序,其中 TTS(文本到语音)由语音命令控制。对于语音识别,我使用的是 pocketsphinx,它在 TTS 未激活时工作正常(即“开始”命令)。但是,当 TTS 处于活动状态时(例如,对于“停止”命令),识别的准确性会下降。
我尝试使用 AcousticEchoCanceler,但似乎没有帮助。你能告诉我:
AEC 是否应该从输入中过滤手机输出?是它不能很好地工作还是它不应该这样做?
我还要尝试什么?
谢谢!