虽然 libsvm 提供了用于缩放数据的工具,但使用 Scikit-Learn(它应该基于 SVC 分类器的 libSVM)我发现无法缩放我的数据。
基本上我想使用 4 个特性,其中 3 个范围从 0 到 1,最后一个是一个“大”的高度可变的数字。
如果我在 libSVM 中包含第四个功能(使用自动缩放数据的 easy.py 脚本),我会得到一些非常好的结果(96% 的准确度)。如果我在 Scikit-Learn 中包含第四个变量,则准确度会下降到 ~78%——但如果我排除它,我会得到与排除该特性时在 libSVM 中得到的结果相同的结果。因此,我很确定这是缺少缩放的问题。
如何以编程方式(即不调用 svm-scale)复制 SVM 的缩放过程?