20

我有一些 R 代码,它使用以下代码对当前目录中的所有文件执行一些数据提取操作:

files <- list.files(".", pattern="*.tts")
results <- lapply(files, data_for_time, "17/06/2006 12:00:00")

lapply 的输出如下(使用 提取dput()) - 基本上是一个充满向量的列表:

list(c("amer", "14.5"), c("appl", "14.2"), c("brec", "13.1"), 
c("camb", "13.5"), c("camo", "30.1"), c("cari", "13.8"), 
c("chio", "21.1"), c("dung", "9.4"), c("east", "11.8"), c("exmo", 
"12.1"), c("farb", "14.7"), c("hard", "15.6"), c("herm", 
"24.3"), c("hero", "13.3"), c("hert", "11.8"), c("hung", 
"26"), c("lizr", "14"), c("maid", "30.4"), c("mart", "8.8"
), c("newb", "14.7"), c("newl", "14.3"), c("oxfr", "13.9"
), c("padt", "10.3"), c("pbil", "13.6"), c("pmtg", "11.1"
), c("pmth", "11.7"), c("pool", "14.6"), c("prae", "11.9"
), c("ral2", "12.2"), c("sano", "15.3"), c("scil", "36.2"
), c("sham", "12.9"), c("stra", "30.9"), c("stro", "14.7"
), c("taut", "13.7"), c("tedd", "22.3"), c("wari", "12.7"
), c("weiw", "13.6"), c("weyb", "8.4"))

但是,我想将此输出作为具有两列的数据框处理:一列用于字母代码("amer""appl"),另一列用于数字(14.514.2)。

不幸的是,as.data.frame似乎不适用于列表中嵌套向量的输入。我应该如何进行转换?我是否需要更改函数data_for_time返回值的方式?目前它只是返回c(name, value)。或者有没有一种很好的方法可以将这种输出转换为数据框?

4

4 回答 4

48

results如果你的清单是这样,试试这个:

> as.data.frame(do.call(rbind, results))

     V1   V2
1  amer 14.5
2  appl 14.2
3  brec 13.1
4  camb 13.5
...
于 2012-05-14T21:00:28.703 回答
15

一种选择可能是使用plyrldply包中的函数,它将为您将内容重新拼接到数据框中。

一个简单的例子:

ldply(1:10,.fun = function(x){c(runif(1),"a")})
                    V1 V2
1    0.406373084755614  a
2    0.456838687881827  a
3    0.681300171650946  a
4    0.294320539338514  a
5    0.811559669673443  a
6    0.340881009353325  a
7    0.134072444401681  a
8  0.00850683846510947  a
9    0.326008745934814  a
10    0.90791508089751  a

但请注意,如果您将变量类型与 混合c(),您可能希望函数更改为简单地返回data.frame(name= name,value = value)而不是c(name,value). 否则一切都将被强制转换为角色(就像我上面的例子一样)。

于 2012-05-14T21:00:23.757 回答
3
inp <- list(c("amer", "14.5"), c("appl", "14.2"), .... # did not see need to copy all

data.frame( first= sapply( inp, "[", 1), 
            second =as.numeric( sapply( inp, "[", 2) ) )

   first second
1   amer   14.5
2   appl   14.2
3   brec   13.1
4   camb   13.5
5   camo   30.1
6   cari   13.8
snipped output
于 2012-05-14T22:35:10.093 回答
2

因为Nelton接受了我正在给予的回应,而Joran接受了我能想到的唯一其他合理的回应,因为我应该写一篇论文,所以这是一个荒谬的答案:

#I named your list LIST
LIST2 <-  LIST[[1]]
lapply(2:length(LIST), function(i) {LIST2 <<- rbind(LIST2, LIST[[i]])})
data.frame(LIST2)
于 2012-05-14T21:16:57.827 回答