3

我有一个大的(500k x 500k)稀疏矩阵。我想了解它的主要组成部分(事实上,即使只计算最大的 PC 也可以)。随机 PCA 效果很好,除了它本质上是寻找协方差矩阵的特征向量而不是相关矩阵。关于使用大型稀疏矩阵的协方差矩阵找到 PCA 的包的任何想法?最好在 python 中,尽管 matlab 和 R 也可以。

(作为参考,这里提出了一个类似的问题,但这些方法是指协方差矩阵)。

4

2 回答 2

0

他们不是一回事吗?据我了解,相关矩阵只是由每个变量的标准偏差的乘积归一化的协方差矩阵。而且,如果我没记错的话,PCA 中是否存在缩放歧义?

于 2012-11-28T21:28:26.457 回答
0

Have you ever tried irlba package in R - "The IRLBA package is the R language implementation of the method. With it, you can compute partial SVDs and principal component analyses of very large scale data. The package works well with sparse matrices and with other matrix classes like those provided by the Bigmemory package." you can check here for details

于 2012-11-28T21:38:44.633 回答