我正在尝试使用 SPSS 查找数据库中各种变量的均值的置信区间,但遇到了一些麻烦。
数据是加权的,因为每个接受调查的人都代表总人口的不同部分。例如,我们样本中的一名年轻人可能代表普通人群中的 28000 名年轻人。问题是 SPSS 似乎认为这个年轻人的数据库条目每个都代表 28000 个测量值,而实际上它们只代表一个,这使得 SPSS 认为我们拥有的数据比实际多得多。结果,SPSS 给出了非常低的标准误差估计和非常非常窄的置信区间。
我尝试通过将每个重量值除以平均重量来解决此问题。这给出了合理的数字和平均权重 1,但我不确定结果数字实际上是否正确。
我的方法合理吗?如果没有,我应该尝试什么?
我一直在使用 Explore 命令来查找平均误差和标准误差(除其他外),以防万一。