我正在尝试从频谱图中提取声学特征(egemaps 和比较特征集)(我无权访问 .wav 文件)。我可以通过在 python 上使用 opensmile 库来轻松地在音频文件上执行此操作:
import opensmile
smile = opensmile.Smile(
feature_set=opensmile.FeatureSet.ComParE_2016,
feature_level=opensmile.FeatureLevel.Functionals,
)
y = smile.process_file('audio.wav')
有没有类似的简单方法可以直接应用于频谱图?