3

我有以下扩展网格的结果:

d <- expand.grid(c("x","y","z"),c("x","y","z"))

请注意向量可能长于 3 并且字符串长度可能更大或不同的模式?

我想要的是创建一个字符串组合,但只有所有组合的一半:

  Var1 Var2
1    x    x
2    y    x
3    y    y
4    z    y
5    x    z
6    z    z
4

1 回答 1

4

您可以通过首先对数据中的行进行排序,然后使用以下方法消除重复项来消除重复项 ( x- y== y- ) :xduplicated

d2 = t(apply(d, 1, sort))
d2[!duplicated(d2),]
     [,1] [,2]
[1,] "x"  "x" 
[2,] "x"  "y" 
[3,] "x"  "z" 
[4,] "y"  "y" 
[5,] "y"  "z" 
[6,] "z"  "z" 

或者,您可以使用combn来获取组合,然后您只需要一些数据修补即可获得所需的内容:

levs = c("x", "y", "z")
comb_level1 = combn(levs, 1)
comb_level2 = combn(levs, 2)
t(cbind(rbind(comb_level1, comb_level1), comb_level2))
     [,1] [,2]
[1,] "x"  "x" 
[2,] "y"  "y" 
[3,] "z"  "z" 
[4,] "x"  "y" 
[5,] "x"  "z" 
[6,] "y"  "z"

我认为使用的解决方案duplicated更好。

于 2013-06-10T05:37:26.490 回答