我正在使用大型数据集进行研究(4.72GB),我在 R 中发现了“bigmemory”包,据说可以处理大型数据集(最大 10GB)。但是,当我使用 read.big.matrix 读取 csv 文件时,出现以下错误:
> x <- read.big.matrix("x.csv", type = "integer", header=TRUE, backingfile="file.bin", descriptorfile="file.desc")
Error in read.big.matrix("x.csv", type = "integer", header = TRUE,
: Dimension mismatch between header row and first data row.
我认为问题在于 csv 文件未满,即多个单元格中缺少值。我尝试删除 header = TRUE 但随后 R 中止并重新启动会话。
有没有人有使用 read.big.matrix 读取缺少数据的大型 csv 文件的经验?