3

我有许多名为“ abcd001.txt,abcd002.txt”的制表符分隔的.txt文件......存储在一个目录中。我可以使用以下代码导入它们(默认目录与数据文件目录相同)。它的三列,都是数字类型的数据

filenames <- list.files(path=".",pattern="abcd+.*txt")

#list of data in R
names <-substr(filenames,1,6)


for(i in names){
    filepath <- file.path(".",paste(i,".txt",sep=","))
    assign(i, read.table(filepath,
     colClasses=c("numeric"),
    sep = "\t"))
}

代码本身没有返回任何错误。我的疑问是如何访问正在加载的数据?如何访问说文件 abcd011.txt 的数据应该是三列数据

commands:names[3] 只返回文件号 000002 但没有数据。

此处的代码与此处的代码类似:将多个 CSV 文件读取到单独的数据帧中。

4

1 回答 1

8

我建议将结果read.table放在一个列表中,或者放在一位 data.frame 中。此外,我建议apply在此处使用样式循环,标准 R ( lapply) 或plyr. 我更喜欢 using plyr,所以我的示例将使用该包。一个例子:

## Read into a list of files:
filenames <- list.files(path=".",pattern="abcd+.*txt")
list_of_data = llply(filenames, read.table, 
                                        colClasses = c("numeric"), sep = "\t")

现在可以使用以下方法访问数据:

list_of_data[[1]]
list_of_data[["abcd1.txt"]]

或者您可以将文件的内容读入一个大文件data.frame

big_data = ldply(filenames, read.table, 
                             colClasses = c("numeric"), sep = "\t"))

现在可以使用以下方法访问文件的内容:

big_data[big_data$variable == "abcd1.txt",]
于 2012-10-29T12:27:42.413 回答