38

我有一个 data.frame df,我希望其中的每一行都是df重复lengthTime的时间,并且添加一个从 1 到.lengthTimedf

我知道,这听起来很复杂,但我基本上想要的是expand.grid申请df. 这是一个丑陋的解决方法,我觉得大多数都有一个更简单的解决方案(甚至可能是一个 base-R 函数?):

df <- data.frame(ID   = rep(letters[1:3], each=3),
                 CatA = rep(1:3, times = 3),
                 CatB = letters[1:9])
lengthTime <- 3
nrRow <- nrow(df)
intDF <- df
for (i in 1:(lengthTime - 1)) {
  df <- rbind(df, intDF)
}
df$Time <- rep(1:lengthTime, each=nrRow)

我以为我可以只使用expand.grid(df, 1:lengthTime),但这不起作用。outer也没有带来任何运气。那么有人知道一个好的解决方案吗?

4

6 回答 6

61

自从这个问题发布以来已经有一段时间了,但我最近发现它只是在寻找标题中的东西,即expand.grid适用于数据框的东西。发布的答案解决了 OP 更具体的问题,所以如果有人正在寻找更通用的数据帧解决方案,这里有一个更通用的方法:

expand.grid.df <- function(...) Reduce(function(...) merge(..., by=NULL), list(...))

# For the example in the OP
expand.grid.df(df, data.frame(1:lengthTime))

# More generally
df1 <- data.frame(A=1:3, B=11:13)
df2 <- data.frame(C=51:52, D=c("Y", "N"))
df3 <- data.frame(E=c("+", "-"))
expand.grid.df(df1, df2, df3)
于 2014-02-20T14:48:38.137 回答
19

为什么不只是df[rep(1:nrow(df),times = 3),]扩展数据框,然后像上面一样添加额外的列,使用df$Time <- rep(1:lengthTime, each=nrRow)?

于 2012-07-27T18:39:28.380 回答
18

您也可以只做一个简单merge的 by NULL(这将导致merge做简单的组合数据复制):

merge(data.frame(time=1:lengthTime), iris, by=NULL)
于 2014-11-03T14:27:45.897 回答
13

快速更新

现在在包 tidyr 中还有 cross() 函数,它可以用来代替合并,速度更快,并返回一个 tbl_df / tibble。

data.frame(time=1:10) %>% merge(iris, by=NULL) 

data.frame(time=1:10) %>% tidyr::crossing(iris) 
于 2016-08-16T12:13:41.630 回答
2

这有效:

REP <- rep(1:nrow(df), 3)
df2 <- data.frame(df[REP, ], Time = rep(1:3, each = 9))
rownames(df2) <- NULL
df2
于 2012-07-27T18:40:31.867 回答
1

一个data.table解决方案:

> library(data.table)
>  ( df <- data.frame(ID   = rep(letters[1:3], each=3),
+                  CatA = rep(1:3, times = 3),
+                  CatB = letters[1:9]) )
  ID CatA CatB
1  a    1    a
2  a    2    b
3  a    3    c
4  b    1    d
5  b    2    e
6  b    3    f
7  c    1    g
8  c    2    h
9  c    3    i
> ( DT <- data.table(df)[, lapply(.SD, function(x) rep(x,3))][, Time:=rep(1:3, each=nrow(df0))] )
    ID CatA CatB Time
 1:  a    1    a    1
 2:  a    2    b    1
 3:  a    3    c    1
 4:  b    1    d    1
 5:  b    2    e    1
 6:  b    3    f    1
 7:  c    1    g    1
 8:  c    2    h    1
 9:  c    3    i    1
10:  a    1    a    2
11:  a    2    b    2
12:  a    3    c    2
13:  b    1    d    2
14:  b    2    e    2
15:  b    3    f    2
16:  c    1    g    2
17:  c    2    h    2
18:  c    3    i    2
19:  a    1    a    3
20:  a    2    b    3
21:  a    3    c    3
22:  b    1    d    3
23:  b    2    e    3
24:  b    3    f    3
25:  c    1    g    3
26:  c    2    h    3
27:  c    3    i    3

另一个 :

> library(data.table)
>  ( df <- data.frame(ID   = rep(letters[1:3], each=3),
+                  CatA = rep(1:3, times = 3),
+                  CatB = letters[1:9]) )
> DT <- data.table(df)
> rbindlist(lapply(1:3, function(i) cbind(DT, Time=i)))
    ID CatA CatB Time
 1:  a    1    a    1
 2:  a    2    b    1
 3:  a    3    c    1
 4:  b    1    d    1
 5:  b    2    e    1
 6:  b    3    f    1
 7:  c    1    g    1
 8:  c    2    h    1
 9:  c    3    i    1
10:  a    1    a    2
11:  a    2    b    2
12:  a    3    c    2
13:  b    1    d    2
14:  b    2    e    2
15:  b    3    f    2
16:  c    1    g    2
17:  c    2    h    2
18:  c    3    i    2
19:  a    1    a    3
20:  a    2    b    3
21:  a    3    c    3
22:  b    1    d    3
23:  b    2    e    3
24:  b    3    f    3
25:  c    1    g    3
26:  c    2    h    3
27:  c    3    i    3
于 2015-08-25T18:16:27.783 回答