10

我试图找到一种方法来比较使用 MATLAB 在不同乐器上播放的相同音符的短 500 毫秒录音的相似性。

详细讨论这个特定主题:我是一名音乐专业的学生,​​我的任务是客观地确定各种现代低铜管乐器的音调,以确定什么乐器应该取代过时的“ophicleide”或低音键号角。我首先对它的光谱仪和其他 6 种仪器进行了视觉比较,但这种方法过于主观。

我用相同的麦克风、设备、增益电平和相同的音符录制了所有乐器。出于这个原因,我相信信号足够相似,可以使用 MATLAB 工具。

我相信比较将fft是最准确的计算。我首先尝试了频域相关性,并测试了相同音调的不同片段(eueu2是变量)

>> corr(abs(fft(eu)),abs(fft(eu2)))
ans = 0.9963

这是朝着正确方向迈出的一步,但是当我比较不同的信号时,我似乎得到了相反的结果:(上低音号和 ophicleide 听起来几乎相同)

>> corr(abs(fft(eu)),abs(fft(ophi)))  
ans =   0.5242

次中音号和低音单簧管听起来完全不同,但这显示出更高的相关性

>> corr(abs(fft(eu)),abs(fft(basscl)))   
ans = 0.8506

我尝试了一个我在网上找到的归一化最大互相关幅度公式,但我得到了相同的结果

>> norm_max_xcorr_mag = @(x,y)(max(abs(xcorr(x,y)))/(norm(x,2)*norm(y,2))); x =eu2; y = eu; norm_max_xcorr_mag(x,y)
ans =   0.9638

比较其他样本时,我得到了类似的结果

 >> norm_max_xcorr_mag = @(x,y)(max(abs(xcorr(x,y)))/(norm(x,2)*norm(y,2))); x = eu; y = basscl; 
ans = 0.6825

相比

>> norm_max_xcorr_mag = @(x,y)(max(abs(xcorr(x,y)))/(norm(x,2)*norm(y,2))); x = eu; y = ophi; norm_max_xcorr_mag(x,y)
ans = 0.3519

上低音号和低音单簧管 (basscl) 具有完全不同的声音和完全不同的谐波系列,但这些公式显示出比上低音号和 Ophicleide 更紧密的相关性,它们的频段看起来几乎是相同的匹配。

我担心这些相关性显示了真实音高的相关性(我在所有这些乐器上演奏相同的音符,但 Ophicleide 可能失调高达 1 Hz)它也可能是相位的原因,甚至总振幅。

有谁知道比较这些复杂波形的谐波比例的更好的清晰方法?

还是我在叫错树?

4

2 回答 2

2

关于您的具体问题,您计算的数量本质上是光谱相干函数的最大值。问题在于,如果信号在统计上是平稳的,那么频谱相干性只是衡量两个信号之间相关性的良好指标。也就是说,如果信号中频率的概率分布不随时间变化。

不幸的是,乐器音符信号不太可能是静止的,因为在区分同一音符在不同乐器上对人耳“发声”的差异方面最重要的特征是谐波和调制很可能是时间在音符的持续时间内变化。

因此,您需要一个频域或时频域度量来更好地捕捉音符频谱的非平稳部分之间的相似性,而不是使用频谱相干性。

在这一点上,选择哪些 MATLAB 函数已不再是问题(尽管如果您有该工具箱,请查看 Signal Processing Toolbox 文档中的此示例可能会帮助您入门)。更多的是研究信号处理和特征分类技术的问题。在这里,您确实必须阅读有关音乐声学的文献。这只是一个抽象链接- 我无权访问 ACM,但如果您是学生,您可以通过您的大学访问。

祝你好运,听起来像一个有趣的问题!

于 2014-06-07T00:11:24.567 回答
1

我不是该主题的专家,但我知道一些可以帮助解决此类问题的音频功能:线性预测编码 (LPC) 和梅尔频率倒谱系数 (MFCC)。

快速搜索将显示大量信息。作为一个例子,我找到了这个这个(没有阅读它们,但它们看起来很相关)。

那应该让你开始。根据您的兴趣,您可以深入研究这个主题。例如,一件事是比较不同乐器演奏的音符的稳态,但我的理解是瞬态(起音)在感知上是极其相关的。

祝你好运!

于 2014-06-03T08:42:26.147 回答