假设我有一个df
包含三个变量df$x
、df$y
、的数据框df$z
,并且有一个分组变量df$g
。
通常,要在每个组内计算一个函数,我会执行以下操作
df$new<-unlist(tapply(df$x,df$g,FUN=myfunc))
现在假设我想从group 的每个值的x
ony
和z
WITHIN的回归中生成残差g
,我该如何实现它?
更具体地说,如果不使用组,我会这样做
df$new<-resid(lm(df$x ~ df$y + df$z, na.action, na.exclude))
在组内执行前面的操作的一种解决方案是对“df$g”的唯一元素使用循环,但如果有任何矢量化解决方案,那就太好了。