4

我正在尝试将 SVM 与 Weka 框架一起使用。所以我正在使用 Libsvm。我是 SVM 的新手,正在阅读我阅读的 Libsvm 网站上的指南,该指南可以使用 GridSearch 发现 SVM 的最佳参数(成本和伽玛)。所以我在 Weka 上选择了 Grid Search,我得到了一个不好的分类结果(TN 率在 1% 左右)。那么我该如何解释这些结果呢?如果使用最佳参数我得到了不好的结果,我就没有机会获得更好的分类吗?我的意思是:网格搜索给了我使用 SVM 可以获得的最佳结果?

我的数据集由 1124 个实例(89% 负类,11% 正类)组成,有 31 个属性(其中 2 个是名义上的,其他是数字的)。我在整个数据集上使用交叉验证(10 倍)来测试模型。我尝试使用 GridSearch(我将每个属性值规范化在 0 和 1 之间,没有选择特征,但我根据 SVM 理论将类值从 0 和 1 更改为 1 和 -1,但 T 不知道它是否有用)与这些参数:成本从 1 到 18,步长为 1.0,伽马从 -5 到 10,步长为 1.0。结果是灵敏度 93.6% 和特异性 64.8%,但这些需要大约 1 小时才能完成计算!!

与决策树相比,我想获得更好的结果。使用特征选择(信息增益排名)+ SMOTE 过采样 + 成本敏感学习,我获得了 91% 的敏感性和 80% 的特异性。有没有办法在不尝试成本和伽玛值的所有可能范围的情况下调整 SVM?

4

0 回答 0