设 DT 为 data.table:
DT<-data.table(V1=sample(10),
V2=sample(10),
...
V9=sample(10),)
是否有更好/更简单的方法来进行多列重新编码/子分配,如下所示:
DT[V1==1 | V1==7,V1:=NA]
DT[V2==1 | V2==7,V2:=NA]
DT[V3==1 | V3==7,V3:=NA]
DT[V4==1 | V4==7,V4:=NA]
DT[V5==1 | V5==7,V5:=NA]
DT[V6==1 | V6==7,V6:=NA]
DT[V7==1 | V7==7,V7:=NA]
DT[V8==1 | V8==7,V8:=NA]
DT[V9==1 | V9==7,V9:=NA]
变量名是完全任意的,不一定有数字。许多列 (Vx:Vx) 和一个所有的重新编码模式 (NAME==1 | NAME==7, NAME:=something)。
此外,如何将多列子分配给其他东西。例如在 data.frame 样式中:
data[,columns][is.na(data[,columns])] <- a_value