weka - 如何在 Libsvm+Weka 中查找/检测网格搜索的最佳参数？

Question

我正在尝试将 SVM 与 Weka 框架一起使用。所以我正在使用 Libsvm。我是 SVM 的新手，正在阅读我阅读的 Libsvm 网站上的指南，该指南可以使用 GridSearch 发现 SVM 的最佳参数（成本和伽玛）。所以我在 Weka 上选择了 Grid Search，我得到了一个不好的分类结果（TN 率在 1% 左右）。那么我该如何解释这些结果呢？如果使用最佳参数我得到了不好的结果，我就没有机会获得更好的分类吗？我的意思是：网格搜索给了我使用 SVM 可以获得的最佳结果？

我的数据集由 1124 个实例（89% 负类，11% 正类）组成，有 31 个属性（其中 2 个是名义上的，其他是数字的）。我在整个数据集上使用交叉验证（10 倍）来测试模型。我尝试使用 GridSearch（我将每个属性值规范化在 0 和 1 之间，没有选择特征，但我根据 SVM 理论将类值从 0 和 1 更改为 1 和 -1，但 T 不知道它是否有用）与这些参数：成本从 1 到 18，步长为 1.0，伽马从 -5 到 10，步长为 1.0。结果是灵敏度 93.6% 和特异性 64.8%，但这些需要大约 1 小时才能完成计算！！

与决策树相比，我想获得更好的结果。使用特征选择（信息增益排名）+ SMOTE 过采样 + 成本敏感学习，我获得了 91% 的敏感性和 80% 的特异性。有没有办法在不尝试成本和伽玛值的所有可能范围的情况下调整 SVM？

weka - 如何在 Libsvm+Weka 中查找/检测网格搜索的最佳参数？

0 回答 0

Related

Reference