我猜这真的是两个问题。我正在尝试使用 data.table 包来总结一个大型数据集。假设我的原始大型数据集是 df1,不幸的是 df1 有 50 列(y0...y49),我想要 3 个字段(segmentfield1、segmentfield2、segmentfield3)的总和。有没有比输入每个 y0...y49 列更简单的方法?与此相关,data.table 是否有一个通用的 na.rm=T 而不是每个总和都输入它?
dt1 <- data.table(df1)
setkey(dt1, segmentfield1, segmentfield2, segmentfield3)
dt2 <- dt1[,list( y0=sum(y0,na.rm=T), y1=sum(y1,na.rm=T), y2=sum(y2,na.rm=T), ...
y49=sum(y49,na.rm=T) ),
by=list(segmentfield1, segmentfield2, segmentfield3)]