给定一个 的音频文件22 mins (1320 secs)
,Librosa 通过以下方式提取 MFCC 特征
data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)
data.shape (20,56829) 它返回 56829 帧的 20 个 MFCC 特征的 numpy 数组。
我的问题是它是如何计算56829的。有没有什么计算可以实现这个框架?每帧的窗口大小是多少?
给定一个 的音频文件22 mins (1320 secs)
,Librosa 通过以下方式提取 MFCC 特征
data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)
data.shape (20,56829) 它返回 56829 帧的 20 个 MFCC 特征的 numpy 数组。
我的问题是它是如何计算56829的。有没有什么计算可以实现这个框架?每帧的窗口大小是多少?