3

默认情况下是否有理由不标准化所有功能?我意识到它可能不是必要的,例如决策树,但对于某些算法,如 KNN、SVM 和 K-Means。例行地对我的所有功能执行此操作会有什么害处吗?

此外,标准化比标准化更可取的共识似乎是?什么时候这不是一个好主意?

4

1 回答 1

4

根据我的经验,当您的数据集包含具有非常不同范围的特征(例如年龄与每所房子的美元数)时,标准化和规范化会产生最大(积极)的影响

根据我的专业经验,在使用汽车传感器(时间序列)进行项目时,我注意到标准化(最小-最大缩放),即使应用于神经网络,也会对训练产生负面影响过程,当然还有最终结果。诚然,传感器特征(值)是否彼此非常接近。考虑到我正在使用时间序列,这是一个非常有趣的结果,大多数数据科学家默认采用缩放(它们最终是神经网络,符合理论)。

原则上,当数据集中有特定的异常值时,最好应用标准化,因为标准化会产生更小的标准偏差值。以我的拙见,这是标准化往往比标准化更受青睐的主要原因,它比异常值更稳健。

三年前,如果有人问我这个问题,我会说“标准化”是要走的路。现在我说,遵循原则,但在得出某个结论之前测试每个假设。

于 2021-02-21T14:54:23.553 回答