3

我对机器学习很陌生,刚刚被介绍到主成分分析作为一种降维方法。我不明白的是,在哪种情况下,PCA 比简单地从模型中删除一些特征更好?如果目标是获得低维数据,为什么我们不将那些相关的特征分组并保留每组中的一个特征呢?

4

1 回答 1

3

特征减少(例如 PCA)和特征选择(您所描述的)之间存在根本区别。关键的区别在于特征缩减 (PCA) 通过所有原始维度的一些投影将您的数据映射到较低维度,例如 PCA 使用每个维度的线性组合。所以最终的数据嵌入具有来自所有特征的信息。如果您执行特征选择,您会丢弃信息,您会完全失去那里存在的任何东西。此外,PCA 保证您保留给定的数据方差部分。

于 2015-11-19T23:19:56.553 回答