我正在做一些基本的命令识别并为此使用 Google Search Input API。但是我想自己捕获音频,预处理音频(去噪,提升幅度等),将这些修改后的音频发送到识别器并获得结果。是否可以?
我知道您可以使用SpeechRecognizer
withRecognitionListener
来获取音频 usingonBufferReceived
方法。但是我想做预处理而不是后处理。是否有任何解决方法/黑客向谷歌识别器提供处理过的数据?
我正在做一些基本的命令识别并为此使用 Google Search Input API。但是我想自己捕获音频,预处理音频(去噪,提升幅度等),将这些修改后的音频发送到识别器并获得结果。是否可以?
我知道您可以使用SpeechRecognizer
withRecognitionListener
来获取音频 usingonBufferReceived
方法。但是我想做预处理而不是后处理。是否有任何解决方法/黑客向谷歌识别器提供处理过的数据?
预处理音频(去噪、提升幅度等),将修改后的音频发送到识别器并获得结果
通常语音识别系统会遇到这种情况。不正确实施的去噪会降低语音识别的准确性,因为它会以不可预测的方式破坏频谱。幅度提升没有帮助,因为幅度在语音识别的一开始就被归一化。您的预处理只会造成伤害。
如果你还想试试,试试pocketsphinx
http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/