iphone - 高性能代码中的峰值检测

Question

我正在寻找使用 HPS 方法在 iphone 中实现语音音高检测。但是检测到的音调不是很准确。Performous在音高检测方面做得不错。

我查看了代码，但没有完全理解计算背后的理论。他们使用 FFT 并找到峰值。但是他们使用 FFT 输出相位的部分让我感到困惑。我认为他们对语音频率使用了一些启发式方法。

那么，任何人都可以解释一下 Performous 中用于检测音高的算法吗？

score 2 · Accepted Answer

[Performous][1] 从麦克风中提取音高。代码也是开源的。以下是该算法的功能描述，来自编码它的人（Tronic on irc.freenode.net#performous）。

我仍然无法从这些信息中弄清楚并实施它。如果有人管理此问题，请在此处发布您的结果，并评论此回复，以便 SO 通知我。

任务是围绕此代码创建一个最小的 C++ 包装器。

1 回答 1