我有一组包含 6000 个变量的数千条记录。我正在执行橙色的 PCA,只保留 10 个第一个组件。
在绘制得到的特征向量时,我发现它们似乎非常相关。因此,我将相关小部件用于计算成对相关。它给了我非常高的相关性绝对值(more than 0.2 and up to 0.7)
下面是橙色的流程:
(CSV) -data-> (PCA) -EigenVectors-> (Transpose) -Data-> (Correlations)
那么问题是为什么我的特征向量是相关的?
如果有人知道这是从哪里来的,那会让我放心。
非常感谢,