我是 R 和 FF 包的新手,我试图更好地了解 FF 如何允许用户使用大型数据集(>4Gb)。我花了相当多的时间在网上搜索教程,但我能找到的那些通常都超出了我的想象。
我通过做学得最好,所以作为练习,我想知道如何使用任意值创建一个长格式的时间序列数据集,类似于 R 的内置“Indometh”数据集。然后我想把它重塑成宽幅。然后我想将输出保存为 csv 文件。
对于小型数据集,这很简单,可以使用以下脚本来实现:
##########################################
#Generate the data frame
DF<-data.frame()
for(Subject in 1:6){
for(time in 1:11){
DF<-rbind(DF,c(Subject,time,runif(1)))
}
}
names(DF)<-c("Subject","time","conc")
##########################################
#Reshape to wide format
DF<-reshape(DF, v.names = "conc", idvar = "Subject", timevar = "time", direction = "wide")
##########################################
#Save csv file
write.csv(DF,file="DF.csv")
但我想学习为大约 10 Gb 的文件大小执行此操作。我将如何使用 FF 包做到这一点?提前致谢。