给定一个data.table
对象,我会将一些分组列的值折叠到一个对象中,并将生成的对象插入一个新的列中。
dt <- data.table(
c('A|A', 'B|A', 'A|A', 'B|A', 'A|B'),
c(0, 0, 1, 1, 0),
c(22.7, 1.2, 0.3, 0.4, 0.0)
)
setnames(dt, names(dt), c('GROUPING', 'NAME', 'VALUE'))
dt
# GROUPING NAME VALUE
# 1: A|A 0 22.7
# 2: B|A 0 1.2
# 3: A|A 1 0.3
# 4: B|A 1 0.4
# 5: A|B 0 0.0
我认为首先需要指定要分组的列,所以我应该从dt[, OBJECTS := <expr>, by = GROUPING]
.
不幸的是,我不知道<expr>
要使用的表达式,因此结果如下:
# GROUPING OBJECTS
# 1: A|A <vector>
# 2: B|A <vector>
# 3: A|B <vector>
每个<vector>
必须包含其他列的值。例如,第一个<vector>
必须是一个命名向量,相当于:
eg <- c(22.7, 0.3)
names(eg) <- c('0', '1')
# 0 1
# 22.7 0.3