3

我想建立一个功能,比如splitdf(columnA + columnB ~ ., dataframe)

这样它就会为每对可能的columnA and columnB. 它类似于tablextabs

因此对于

> a <- data.frame(x=1:3, y=1:3, z=1:9)
> a
  x y z
1 1 1 1
2 2 2 2
3 3 3 3
4 1 1 4
5 2 2 5
6 3 3 6
7 1 1 7
8 2 2 8
9 3 3 9

我期待:

x = 1, y = 1, 
      x y z
     1 1 1
     1 1 4
     1 1 7

x = 2, y = 2, 
      x y z
     2 2 2
     2 2 5
     2 2 8

x = 3, y = 3, 
      x y z
     3 3 3
     3 3 6
     3 3 9

更新

我意识到了这一点split并且dlply可以工作。但是它们都没有为我提供操纵类别名称的好方法?如何使这些名称有意义?就像我想看到x = 1, y = 1的而不是 $1.1

4

2 回答 2

6

这是你想要的吗?

> library (plyr)
> dlply(a, .(x, y))
$`1.1`
  x y z
1 1 1 1
2 1 1 4
3 1 1 7

$`2.2`
  x y z
1 2 2 2
2 2 2 5
3 2 2 8

$`3.3`
  x y z
1 3 3 3
2 3 3 6
3 3 3 9

更新

> z <- dlply(a, .(x, y))
> names(z) <- dlply(a, .(x, y), function(x) sprintf("x = %d, y = %d", x$x[1], x$y[1]))
> z
$`x = 1, y = 1`
  x y z
1 1 1 1
2 1 1 4
3 1 1 7

$`x = 2, y = 2`
  x y z
1 2 2 2
2 2 2 5
3 2 2 8

$`x = 3, y = 3`
  x y z
1 3 3 3
2 3 3 6
3 3 3 9
于 2013-11-12T11:32:11.273 回答
2

使用基split函数

a <- data.frame(x = 1:3, y = 1:3, z = 1:9)
split(a, f = list(a$x, a$y))
## $`1.1`
##   x y z
## 1 1 1 1
## 4 1 1 4
## 7 1 1 7
## 
## $`2.1`
## [1] x y z
## <0 rows> (or 0-length row.names)
## 
## $`3.1`
## [1] x y z
## <0 rows> (or 0-length row.names)
## 
## $`1.2`
## [1] x y z
## <0 rows> (or 0-length row.names)
## 
## $`2.2`
##   x y z
## 2 2 2 2
## 5 2 2 5
## 8 2 2 8
## 
## $`3.2`
## [1] x y z
## <0 rows> (or 0-length row.names)
## 
## $`1.3`
## [1] x y z
## <0 rows> (or 0-length row.names)
## 
## $`2.3`
## [1] x y z
## <0 rows> (or 0-length row.names)
## 
## $`3.3`
##   x y z
## 3 3 3 3
## 6 3 3 6
## 9 3 3 9
## 
于 2013-11-12T11:46:38.230 回答