0

我是音频处理的初学者。我满足一个要求:将 x 秒的输入音频波形转换为 128 维对数 Mel 滤波器组(库)特征序列,每 10 毫秒计算一次 25 毫秒汉明窗。结果为 128*100x 频谱图。

我对这个过程感到困惑。

4

0 回答 0