这似乎与此 URL 中提出的类似问题(在非常大的稀疏矩阵上应用 PCA)。
但我仍然无法得到我需要帮助的答案。我正在尝试为大约 700 个样本(列)和 > 4,00,000 个基因座(行)的非常大的数据集执行 PCA。我希望在 中绘制“样本”,biplot
因此想考虑所有 4,00,000 个轨迹来计算主成分。
我确实尝试过使用princomp()
,但我收到以下错误消息,
Error in princomp.default(transposed.data, cor = TRUE) :
'`princomp`' can only be used with more units than variables
我在论坛上查了一下,发现在单位比变量少的情况下,最好使用prcomp()
than princomp()
,所以我也尝试过,但我再次收到以下错误,
Error in cor(transposed.data) : allocMatrix: too many elements specified
所以我想知道你们中是否有人可以建议我任何其他可能最适合我非常大的数据的好选择。我是统计学的初学者,但我确实读过 PCA 的工作原理。我想知道是否有任何其他易于使用的 R 包或工具来执行此操作?