我有一个大数据集,我正在尝试为它构建一个 DAgger 分类器。如您所知,在训练时,我需要在训练实例上运行初始学习分类器(预测它们),一次一个实例。
即使是最初的学习,Libsvm 也太慢了。
我正在使用 OLL,但这需要将每个实例写入一个文件,然后在其上运行测试代码并获得预测,这涉及许多磁盘 I/O。
我考虑过使用 vowpal_wabbit(但我不确定它是否有助于磁盘 I/O),但我没有权限将它安装在我正在使用的集群上。
Liblinear 太慢了,相信又需要磁盘 I/OI。我可以使用哪些其他替代方案?