0

数据称为:data.csv

我尝试了 read.csv('data.csv') 并弹出一条错误消息,说文件太大。

我不确定如何在这种情况下使用 fread,因为当我尝试时:

require(data.table)
DT <- fread("data.csv")

那没有用。

有任何想法吗?

我最终尝试安装“bigmemory”包,但它说

Warning in install.packages :
  package ‘bigmemory’ is not available (for R version 3.2.0)
4

1 回答 1

0

我建议您也尝试以下代码:

tab5rows <- read.table("datatable.txt", header = TRUE, nrows = 5)
classes <- sapply(tab5rows, class)
tabAll <- read.table("datatable.txt", header = TRUE, colClasses = classes)

这里详细讨论可以显着提高读取大文件的速度。更重要的是,第一行将使您能够查看文件内部。如果你能打开它,那么机动的范围就很大。或者,值得以二进制形式读取文件:

messy_file <- readLines(file("ProblematicData.csv", "rb"), encoding="UTF-8", skipNul=TRUE)

编辑

此外,我建议您看一下这个讨论,其中详细讨论了一些读取大文件的选项。

我解决这个问题的方法是:

  1. 或者尝试第一个read.table选项
  2. freaddata.table, 或者尝试
  3. 读取为二进制
于 2015-08-18T15:14:33.963 回答