r - 使用 R 中的 data.table 计算加权平均值，其中一个表列中的权重

Question

我有一个 data.table 如下所示。我正在尝试计算数据子集的加权平均值。我用下面的 MWE 尝试了两种方法

    set.seed(12345)
    dt = data.table(a =c(10,20,25,10,10),b=rnorm(5),c=rnorm(5),d=rnorm(5),e=rnorm(5))
    dt$key = sample(toupper(letters[1:3]),5,replace=T)
    setkey(dt, key)

首先对 .SD 进行子集化并使用 lapply 调用，这不起作用（并且不是真正期望的）

dt[,lapply(.SD,function(x) weighted.mean(x,.SD[1])),by=key]

第二次尝试定义一个函数以应用于 .SD，就像我使用 ddply 一样。

这也失败了。

wmn=function(x){
  tmp = NULL
  for(i in 2:ncol(x)){
    tmp1 = weighted.mean(x[,i],x[,1])
    tmp = c(tmp,tmp1)
  }
  return(tmp)
}

dt[,wmn,by=key]

关于如何最好地做到这一点的任何想法？

谢谢

编辑

更改为所选列上的 wmn 公式错误。

第二次编辑

加权平均公式反转并添加 set.seed

score 12 · Accepted Answer

如果您想使用“a”作为权重来采用“b”...“e”的加权平均值，我认为这可以解决问题：

dt[,lapply(.SD,weighted.mean,w=a),by=key,.SDcols=letters[1:5]]

r - 使用 R 中的 data.table 计算加权平均值，其中一个表列中的权重

1 回答 1

Related

Reference