我正在寻找使用 HPS 方法在 iphone 中实现语音音高检测。但是检测到的音调不是很准确。Performous在音高检测方面做得不错。
我查看了代码,但没有完全理解计算背后的理论。他们使用 FFT 并找到峰值。但是他们使用 FFT 输出相位的部分让我感到困惑。我认为他们对语音频率使用了一些启发式方法。
那么,任何人都可以解释一下 Performous 中用于检测音高的算法吗?
我正在寻找使用 HPS 方法在 iphone 中实现语音音高检测。但是检测到的音调不是很准确。Performous在音高检测方面做得不错。
我查看了代码,但没有完全理解计算背后的理论。他们使用 FFT 并找到峰值。但是他们使用 FFT 输出相位的部分让我感到困惑。我认为他们对语音频率使用了一些启发式方法。
那么,任何人都可以解释一下 Performous 中用于检测音高的算法吗?
[Performous][1] 从麦克风中提取音高。代码也是开源的。以下是该算法的功能描述,来自编码它的人(Tronic on irc.freenode.net#performous)。
我仍然无法从这些信息中弄清楚并实施它。如果有人管理此问题,请在此处发布您的结果,并评论此回复,以便 SO 通知我。
任务是围绕此代码创建一个最小的 C++ 包装器。