Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我一直在尝试规范化我的数据集,该数据集包含许多具有不同分布、规范化、正偏态和负偏态的特征。在将数据归一化作为建立分类模型的初步步骤时,我应该对数据集中的所有特征应用相同的归一化技术,还是应该对数据集中的不同特征应用不同的归一化技术?
也许。
没有一刀切的规则。
例如,如果您有小范围的 x,y 坐标,是的,那么使用相同的归一化可能更合适。与“相同规模”相同,而不仅仅是“相同方法”。如果您有纬度和经度,请不要进行任何归一化,除非您有理由假设地球是扭曲的。如果你有完全不同的尺度,比如属性 A 是“shoe-size”,属性 B 是“pi / shoe-size”,那么是的,你需要对这两个属性进行不同的归一化。
通常,当这个问题出现时,你还没有理解你的数据。