0

一般来说,我需要对 FFT 和音高估计进行一些澄清。

1.)我读到 FFT 的块大小越大,它的准确性就越高,尽管我知道这也有不利的一面。这是真的吗?因为我一直在试验,每当我使用 16384 的块大小而不是 8192 或 4096 时,我得到的结果更糟。有人可以澄清一下吗?

2.) 最初,我认为从 FFT 中获得音高只是获得最高强度的 bin 的简单问题。但是,在这里发布并阅读了一些问题之后,我认为可能还有更多的this。有人可以建议我如何从 FFT 中获得良好的音高估计吗?

3.)虽然我已经有了一个好主意,但有人可以简单地解释一下自相关器算法的作用吗?(我的想法是它基本上是一种比较和对比算法,差异最小的就是选择的算法)

非常感谢!

4

1 回答 1

1
  1. 缺点是处理时间、内存消耗和延迟。如果您想要实时显示,在开始处理之前必须等待整个帧填满可能会花费不可接受的时间。
  2. 是的,还有更多。具体来说,。它也可以是具有最大负值(180 度偏移)的 bin,或者是零(90 度偏移)的 bin,或者介于两者之间的任何值。您可能希望使用复数进行转换,并寻找最大的绝对值。
  3. 该算法通过测试信号与其时移版本的“相似性”来寻找信号中的周期性元素。输出是从时间偏移到“相似度”的映射;然后,您可以寻找最高值。
于 2011-02-22T09:59:28.207 回答