我读了这篇关于特征缩放的文章: all-about-feature-scaling
两种主要的特征缩放技术是:
min-max scaler
- 它对具有非高斯分布的特征响应良好。Standard scaler
- 对具有高斯分布的特征反应良好。
我阅读了其他帖子和示例,似乎我们总是对所有功能使用一种缩放方法(min-max
或standard
)。
我还没有看到建议的示例或论文:
1. go over all the features, and for each feature:
1.1 check feature distribution
1.2 if the feature distribution is Gaussian:
1.2.1 use Standard scaler for this feature
1.3 otherwise:
1.3.1 use min-max scaler for this feature
为什么我们不混合缩放方法?
我的建议有什么问题或缺点?