我目前正在大学做一个项目,我正在使用 python 区分不同乐器演奏相同音高的音符。
我使用连接到计算机的麦克风在不同的乐器上录制了各种音符。
我还记录了房间的背景。
到目前为止,我在不同仪器上绘制了不同音符的图,在 y 轴上,我的振幅以 dB 为单位:20*log10(|FFT(signal)|)
在 x 轴上,我有 DFT 采样频率
一些谐波峰值足够小(或背景足够大),以至于噪声成为一个因素 - (不能发布图像,因为我是菜鸟!)我的问题是计算高度的不确定性水平考虑背景噪声时出现峰值。
我的问题是:
那么,在考虑背景噪声时,如何计算峰高(它们的相对谐波幅度)的不确定性水平。
一些想法:
在对什么是谐波峰值和什么可归因于噪声进行分类时,我应该使用什么 dB 阈值(我应该将低于最大背景(~28000dB)或平均值(~15000)或可能是这些值之一的两倍的峰值打折)?
此外,考虑到背景引入的噪声,从我的仪器记录的 FFT bin n 中减去背景的 FFT bin n 中的值是否合法?
我也看过这篇文章,如何在 MATLAB 中使用 fft 从录制的声音中去除噪音?,那里似乎有很大不同的意见。
如果它是相关的,我可以发布我的代码片段——尽管在同学剽窃的情况下放得太多。
非常感谢对项目有帮助的文献链接。(仍处于我以我能想到的各种方式绘制数据以寻找每种仪器的区别属性的阶段)。
提前致谢