3

情况:1GB CSV 文件,100000 行,4000 个自变量,1 个因变量。R 在 Windows Citrix 服务器上,具有 16GB 内存。

问题:我花了2个小时!去做:

read.table("full_data.csv", header=T, sep",")

glm 进程崩溃,程序没有响应,我必须在任务管理器中将其关闭。

4

1 回答 1

3

我经常求助于包sqldf在内存中加载大的 .csv。一个好的指针就在这里

于 2012-07-09T20:18:55.980 回答