我正在用 Python 构建一些预测模型,并且一直在使用 scikits learn 的 SVM 实现。它真的很棒,易于使用且速度相对较快。
不幸的是,我开始受到运行时的限制。我在大约 4 - 5000 个具有 650 个特征的完整数据集上运行 rbf SVM。每次运行大约需要一分钟。但是使用 5 折交叉验证 + 网格搜索(使用从粗到细的搜索),这对我手头的任务来说有点不可行。所以一般来说,人们对可以在 Python 中使用的最快的 SVM 实现有什么建议吗?那,或者有什么方法可以加快我的建模速度?
我听说过 LIBSVM 的 GPU 实现,它似乎可以工作。我不知道任何其他可在 Python 中使用的 GPU SVM 实现,但它肯定会对其他人开放。另外,使用 GPU 会显着增加运行时间吗?
我还听说有一些方法可以通过在 scikits 中使用线性 SVM + 特征图来逼近 rbf SVM。不确定人们对这种方法的看法。同样,任何使用这种方法的人,它是否显着增加了运行时间?
欢迎所有提高程序速度的想法。