0

我正在尝试使用 SPSS 查找数据库中各种变量的均值的置信区间,但遇到了一些麻烦。

数据是加权的,因为每个接受调查的人都代表总人口的不同部分。例如,我们样本中的一名年轻人可能代表普通人群中的 28000 名年轻人。问题是 SPSS 似乎认为这个年轻人的数据库条目每个都代表 28000 个测量值,而实际上它们只代表一个,这使得 SPSS 认为我们拥有的数据比实际多得多。结果,SPSS 给出了非常低的标准误差估计和非常非常窄的置信区间。

我尝试通过将每个重量值除以平均重量来解决此问题。这给出了合理的数字和平均权重 1,但我不确定结果数字实际上是否正确。

我的方法合理吗?如果没有,我应该尝试什么?

我一直在使用 Explore 命令来查找平均误差和标准误差(除其他外),以​​防万一。

4

1 回答 1

0

您确实需要将权重调整为实际样本大小,但只有“复杂样本”选项中的程序旨在正确考虑抽样权重。统计中的常规权重变量被视为频率权重。

于 2014-06-03T12:42:18.060 回答