2

假设我有:

df <- data.frame(x = rep(as.factor(LETTERS[1:3]), c(1, 2, 3)))

df:
  x
1 A
2 B
3 B
4 C
5 C
6 C

如何根据相同的字母添加另一列(组 ID)df$x

  x group
1 A 1
2 B 2
3 B 2
4 C 3
5 C 3
6 C 3

谢谢!

- - - - - - -编辑 - - - - - - -

对不起,我想我应该改写我的问题。在这里,我们有:

df <- data.frame(x = rep(as.factor(LETTERS[1:3]), c(1, 2, 3)),
                 y = rep(as.factor(LETTERS[3:1]), c(3, 2, 1)))

df
  x y
1 A C
2 B C
3 B C
4 C B
5 C B
6 C A

我需要一列组 ID 来分隔 x 和 y 对:

df
  x y group
1 A C 1
2 B C 2
3 B C 2
4 C B 3
5 C B 3
6 C A 4

感谢帮助!

4

2 回答 2

4

我想这就是你要找的:

df$group = df$x:df$y
#  x y group
#1 A C   A:C
#2 B C   B:C
#3 B C   B:C
#4 C B   C:B
#5 C B   C:B
#6 C A   C:A

group在这种情况下是一个因素。如果您希望它具有数字 ID:

df$group = as.numeric(df$x:df$y)
#  x y group
#1 A C     3
#2 B C     6
#3 B C     6
#4 C B     8
#5 C B     8
#6 C A     7

ETA:如果您希望组 ID 是连续整数:

df$group = match(df$x:df$y, unique(df$x:df$y))
#  x y group
#1 A C     1
#2 B C     2
#3 B C     2
#4 C B     3
#5 C B     3
#6 C A     4
于 2012-08-25T01:04:27.230 回答
1

这个怎么样:

df$group <- as.numeric(factor(with(df, paste(x,y))))

...与其他解决方案非常相似。

于 2012-08-25T04:14:11.587 回答