0

我一直在尝试规范化我的数据集,该数据集包含许多具有不同分布、规范化、正偏态和负偏态的特征。在将数据归一化作为建立分类模型的初步步骤时,我应该对数据集中的所有特征应用相同的归一化技术,还是应该对数据集中的不同特征应用不同的归一化技术?

4

1 回答 1

0

也许

没有一刀切的规则。

例如,如果您有小范围的 x,y 坐标,是的,那么使用相同的归一化可能更合适。与“相同规模”相同,而不仅仅是“相同方法”。如果您有纬度和经度,请不要进行任何归一化,除非您有理由假设地球是扭曲的。如果你有完全不同的尺度,比如属性 A 是“shoe-size”,属性 B 是“pi / shoe-size”,那么是的,你需要对这两个属性进行不同的归一化。

通常,当这个问题出现时,你还没有理解你的数据。

于 2013-10-01T08:01:00.430 回答