所以我有一个转换后的复数数组。我不知道如何处理返回的数据。我尝试计算每个元素的幅度,将具有最高元素的元素指定为正确频率,但发现我经常得到像 5,000hz 这样的奇怪数字。我可以对返回的数据执行更好的操作来确定音高吗?
注意:我想将音调用作语音活动检测算法的一部分。
所以我有一个转换后的复数数组。我不知道如何处理返回的数据。我尝试计算每个元素的幅度,将具有最高元素的元素指定为正确频率,但发现我经常得到像 5,000hz 这样的奇怪数字。我可以对返回的数据执行更好的操作来确定音高吗?
注意:我想将音调用作语音活动检测算法的一部分。
音高检测有许多不同的算法 - 我建议您尝试使用谐波乘积谱方法,因为您已经开始了基于 FFT 的路线,并且实现一个具有功率谱的方法相当简单。