我正在从事一个项目,该项目必须识别频率不同的波形文件之间的相似模式。
例如,人类的语音频率彼此不同。如果我要识别人类是否在哭泣,大喊大笑的声音,无论频率如何,哭声之间都应该有一种模式。
所以我正在寻找一种可以识别这些元素的算法。
对于基于图像的识别,主成分分析和它的兄弟姐妹,如内核 PCA 或线性判别分析是正确的。PCA 是一种适用于任何类型数据的算法,所以我认为也适用于声音。
我会将 wav 转换为 int-Vectors 并在其上运行 PCA 以提取特征。
JMathTools非常适合...
这个我也发现...
希望我能帮到你...