我在 Octave 中整理了一个机器学习例程,如下所示:
- 从声音文件中提取特征
- 特征被缩放和标准化
- 训练 SVM 分类器
- 进行分类
我遇到的问题是步骤 2,3 和 4 需要几秒钟的时间才能完成整个数据库。但是,第 1 步每个文件大约需要 1 秒,这太长了。
花费这么长时间的原因是 - 在大多数情况下 - 因为我正在使用每个文件执行多个指数拟合leasqr
。
由于我每个班级大约有 1500 个声音文件和 3 个或更多班级,所以它开始加起来。我想扩展到 15,000 个文件,并且以当前不可行的特征提取速度。
我必须一遍又一遍地处理特征提取步骤的原因是因为我一直在使用它来调整我的分类器性能。例如,通过改变执行指数拟合的范围。
我的问题如下。我没有在外部运行繁琐流程的经验,但这会是一个可行的解决方案吗?如果是这样,对于这种情况,什么是好的/标准做法?如果没有,什么是好的做法?