我有 HTK 从 .wav 文件生成的 MFCC(梅尔频率倒谱系数)文件。我需要的是从 MFCC 中提取一个时间跨度。当 MFCC 文件代表 90 分钟长度的音频时,我想获得例如 MFCC 音频的第三分钟。
HTK 书说 MFCC 文件由一个标题和一个连续的样本序列组成。但是以字节为单位确定样本的确切大小似乎并不容易。
是否有文件解析器?(当然有,在 HTK 中,但我没有设法弄清楚如何使用二进制文件来完成这项任务。)
或者是否有一种简单的方法来确定样本和标题的大小,以便能够简单地将文件分开?