scikit-learn 的 SVM 基于 LIBSVM。LIBSVM/SVM 要求对数据进行缩放,建议特征值应在 [0, 1] 或 [-1, 1] 两个范围之一。也就是说,在典型的矩阵中,每一列都是一个特征,并且每列都进行缩放。
LIBSVM FAQ 建议使用简单的缩放来获得 [0, 1] 之间的特征:
x'=(x-min)/(Max-min)
scikit-learn 是否支持这种“简单缩放”?是否有其他建议可以扩展功能以与 SVM 和 RBF 内核一起使用。有参考吗?我找到了一篇名为“支持向量分类实用指南”的参考文章,它基于 LIBSVM,他们建议缩放到 [0, 1] 或 [-1, 1]。