1

我正在尝试在R中读取一张大表(大约 500000 x 1000) 。

read.table有效,但速度非常慢。

scan也可以工作,而且速度还可以,但是我无法将其格式更改为正常的 data.frame 或矩阵。

我事先不知道表格的行数(我可以通过 找到列数template_line <- read.table(nrow=1,file=my_file))。它需要与R 2.15 兼容 - 所以这似乎fread是不可能的。

所以问题是:我如何转换输出:

my_matrix <- scan(file=my_file,what=template_line);  

到 data.frame 或矩阵(快速)?

或者:如果我不知道大小,如何在R中快速读取整数表?

4

1 回答 1

0

那这个呢?

num_cols <- 5
my_matrix <- matrix(scan(file=my_file, what=template_line), ncol=num_cols, byrow=TRUE)
于 2013-10-17T15:17:06.720 回答