4

我不知道从哪里开始这段代码。我想将一个新变量附加到现有数据框中,该数据框根据分组变量采用不同的列。例如,假设我有列

    A  B  C  D  E  F
    1  2  3  6  11 12
    1  7  5  10 8  9
    2  19 2  4  5  6
    2  8  4  3  1  1

我想附加一个新列“G”,如果 A 为 1,则为 B 列,如果 A 为 2,则为 D 列

    A  B  C  D  E  F   G
    1  2  3  6  11 12  2 
    1  7  5  10 8  9   7
    2  19 2  4  5  6   4
    2  8  4  3  1  1   3

谢谢

4

2 回答 2

9

这里有几个选项。

假设您的 data.frame 被调用DF

基本[和索引

# make everything in G =  B
DF$G <- DF$B
# replace those cases where A==2 with D
DF$G[DF$A==2] <- DF$D[DT$A==2]

使用 ifelse

ifelse需要一个陈述,因为 A 是 1 或 2

DF$G <- ifelse(DF$A==2, DF$D, DF$B)

使用数据表

我喜欢 data.table,因为内存效率和编码优雅

library(data.table)
# create a data.table with A as the key

DT <- data.table(DF, key = 'A')
# where the key (A) == 1 ], then assign G = B
DT[.(1), G := B]
# and where the key (A) == 2, then assign G = D
DT[.(2), G := D]

精美优雅!

于 2013-02-07T05:46:49.683 回答
5

假设你data.frame被称为“mydf”,你可以使用ifelse

within(mydf, {
  G <- ifelse(A == 1, B,
              ifelse(A == 2, D, 
                     0))
})
#   A  B C  D  E  F G
# 1 1  2 3  6 11 12 2
# 2 1  7 5 10  8  9 7
# 3 2 19 2  4  5  6 4
# 4 2  8 4  3  1  1 3
于 2013-02-07T05:40:57.340 回答