r - 在非常大的数据集上执行 PCA 的最佳工具或包是什么？

翻译自：https://stackoverflow.com/questions/12630807 2012-09-27T22:14:14.187

853 次

但我仍然无法得到我需要帮助的答案。我正在尝试为大约 700 个样本（列）和 > 4,00,000 个基因座（行）的非常大的数据集执行 PCA。我希望在中绘制“样本”，biplot因此想考虑所有 4,00,000 个轨迹来计算主成分。

我确实尝试过使用princomp()，但我收到以下错误消息，

Error in princomp.default(transposed.data, cor = TRUE) : 
'`princomp`' can only be used with more units than variables

我在论坛上查了一下，发现在单位比变量少的情况下，最好使用prcomp()than princomp()，所以我也尝试过，但我再次收到以下错误，

Error in cor(transposed.data) : allocMatrix: too many elements specified

所以我想知道你们中是否有人可以建议我任何其他可能最适合我非常大的数据的好选择。我是统计学的初学者，但我确实读过 PCA 的工作原理。我想知道是否有任何其他易于使用的 R 包或工具来执行此操作？

0 回答 0