correlation - 为什么我的特征向量在 PCA 之后非常相关

Question

我有一组包含 6000 个变量的数千条记录。我正在执行橙色的 PCA，只保留 10 个第一个组件。

在绘制得到的特征向量时，我发现它们似乎非常相关。因此，我将相关小部件用于计算成对相关。它给了我非常高的相关性绝对值(more than 0.2 and up to 0.7)

下面是橙色的流程：

(CSV) -data-> (PCA) -EigenVectors-> (Transpose) -Data-> (Correlations)

那么问题是为什么我的特征向量是相关的？

如果有人知道这是从哪里来的，那会让我放心。

非常感谢，

score 0 · Accepted Answer

PCA 特征向量形成标准正交基。然而，这并不意味着它们是不相关的。

例如，3D 中的标准单位向量（[1, 0, 0], [0, 1, 0], [0, 0, 1]）都与 -0.5 的系数相关。

1 回答 1