machine-learning - scikit-learn 标准化值中的机器学习算法？

Question

首先使用 scikit-learn 模块的机器学习算法进行图像集，我该如何准备特征图像？我可以用标准偏差（即最近邻或聚类算法）对值进行归一化吗？或者我可以用 (featureValue-min) / (max -min) 线性缩放，正如我在这里看到的：http ://www.csie.ntu.edu.tw/~cjlin/talks/mlss_kyoto.pdf for svm。

score 2 · Accepted Answer

请阅读以下内容：ftp: //ftp.sas.com/pub/neural/FAQ2.html#A_std 如果您的特征是从高斯分布中提取的，那么您使用 SD 和均值进行标准化。否则，您只需标准化/重新缩放以将它们带到 0-1 的范围内。许多预处理往往取决于数据和所选择的技术。找到最适合您的数据和技术的内容。

score 0 · Accepted Answer

并非所有算法都需要归一化的输入向量，例如随机森林算法。但是，如果您选择的算法需要归一化，比如 SVM，则使用来自预处理模块的 Sklearn 中可用的归一化器对其进行归一化，并在拟合之前将您的数据转换为归一化数据。此外，如果您尝试对图像进行分类，请查看 sklearn 中的 PCA（主成分分析），这有助于您使用选定的特征进行处理并提供更好的性能和结果

machine-learning - scikit-learn 标准化值中的机器学习算法？

2 回答 2

Related

Reference