我有一个完整的臭氧数据集,其中包含一些缺失值。我想使用 SPSS 进行单一插补来插补我的数据。
在开始估算我的数据之前,我想随机模拟缺失数据的 5%、10%、15%、25% 和 40% 的数据模式,以评估估算方法的准确性。
有人可以教我如何使用 SPSS 做随机丢失的数据模式吗?
除此之外,有人可以告诉我如何获得性能指标,例如:平均绝对误差、确定系数和均方根误差,以便检查估计缺失值的最佳方法。
我有一个完整的臭氧数据集,其中包含一些缺失值。我想使用 SPSS 进行单一插补来插补我的数据。
在开始估算我的数据之前,我想随机模拟缺失数据的 5%、10%、15%、25% 和 40% 的数据模式,以评估估算方法的准确性。
有人可以教我如何使用 SPSS 做随机丢失的数据模式吗?
除此之外,有人可以告诉我如何获得性能指标,例如:平均绝对误差、确定系数和均方根误差,以便检查估计缺失值的最佳方法。
你第一个问题的答案。假设您的研究变量是y
并且您想模拟变量的缺失y
。y_miss
这是根据您的缺失数据模式计算额外变量的示例代码。
do if uniform(1) < .05.
comp y_miss = $SYSMIS.
else.
comp y_miss = y.
end if.
不幸的是,我目前的 SPSS 支持不丢失数据分析,所以我只能给出一些一般性的建议。
首先:对于您丢失的数据模式:只需转到数据 -> 选择案例 -> 随机样本并删除所需数量的案例,然后运行插补。
如果您使用他们的插补模块,您提到的值应该由 spss 提供。有一本手册:ftp: //public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/de/client/Manuals/IBM_SPSS_Missing_Values.pdf