我在 CSV 文件中有一个非常大的训练集(~2Gb)。该文件太大而无法直接读入内存(read.csv()
使计算机停止运行),我想使用 PCA 减小数据文件的大小。问题是(据我所知)我需要将文件读入内存才能运行 PCA 算法(例如,princomp()
)。
我已经尝试使用该包bigmemory
将文件作为.big.matrix
princomp
big.matrix
big.matrix
data.frame
有没有办法princomp
在我丢失的大型数据文件上运行?
我是 R 的相对新手,所以其中一些对于经验丰富的用户来说可能是显而易见的(提前道歉)。
感谢您提供任何信息。