首先使用 scikit-learn 模块的机器学习算法进行图像集,我该如何准备特征图像?我可以用标准偏差(即最近邻或聚类算法)对值进行归一化吗?或者我可以用 (featureValue-min) / (max -min) 线性缩放,正如我在这里看到的:http ://www.csie.ntu.edu.tw/~cjlin/talks/mlss_kyoto.pdf for svm。
问问题
413 次
2 回答
2
请阅读以下内容:ftp: //ftp.sas.com/pub/neural/FAQ2.html#A_std 如果您的特征是从高斯分布中提取的,那么您使用 SD 和均值进行标准化。否则,您只需标准化/重新缩放以将它们带到 0-1 的范围内。许多预处理往往取决于数据和所选择的技术。找到最适合您的数据和技术的内容。
于 2013-02-13T14:09:08.517 回答
0
并非所有算法都需要归一化的输入向量,例如随机森林算法。但是,如果您选择的算法需要归一化,比如 SVM,则使用来自预处理模块的 Sklearn 中可用的归一化器对其进行归一化,并在拟合之前将您的数据转换为归一化数据。此外,如果您尝试对图像进行分类,请查看 sklearn 中的 PCA(主成分分析),这有助于您使用选定的特征进行处理并提供更好的性能和结果
于 2016-11-20T13:15:40.010 回答