我有一个带有原始分数和样本权重的数据文件。现在我想使用 psych 包的 describe 函数,同时考虑到样本权重。
有谁知道如何做到这一点,或者在某处是否有与 psych::describe() 完全相同但可以处理样本权重的函数?
下一个示例将提供一些关于我打算做什么的见解。
library(psych)
describe(c(2,3,4,1,4,5,3,3))
#gives:
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 8 3.12 1.25 3 3.12 1.48 1 5 4 -0.2 -1.16 0.44
样本权重为:
c(0.2,0.5,1.2,1.5,0.2,0.6,0.6,1.1)
加权平均值将是(如果我错了,请纠正我):
sum(c(2,3,4,1,4,5,3,3)* c(0.2,0.5,1.2,1.5,0.2,0.6,0.6,1.1))/sum(c(0.2,0.5,1.2,1.5,0.2,0.6,0.6,1.1))
[1] 2.898305
所以这当然不同于未加权的平均值。如何确保报告的 SD、峰度、偏度等也基于样本加权平均值?