0

我正在尝试使用 PyBrain 实现一个简单的单个数字分类器。我有许多记录的数字 0 到 9 示例的训练数据,并编写了一个脚本来为每个示例提取 MFCC。为了简单起见(目前),我只计算 13 个系数,并且每 10 毫秒对音频文件进行一次采样。由于每个记录的训练示例都具有不同的持续时间,例如,所有“零”集合的样本数量会根据音频的长度而变化。因此,对于“零”的一些示例,我有一个形状为 (67,13) 的 MFCC 训练向量,而对于其他人,它可能是 (44, 13)。

问题是在 PyBrain 中创建数据集时,输入向量的维度必须是统一的,并且应该包含与列相同的行数。

是否有某种方法可以定义数据集,以便输入向量具有固定数量的列(13 个 MFCC)但可变的行数(取决于从信号中获取的样本数量)?还是我这样做完全错了?

我已经在网上和 Stack Overflow 上进行了搜索和搜索,但无法找到答案。我可以遵循并实现教程中的 Pybrain 示例。

4

1 回答 1

0

哦。显然,我需要使用特定数字的所有向量来估计多维概率密度函数。

于 2012-10-05T10:23:42.097 回答