你能给我一些提示来识别分类变量缺失值的缺失性质吗?我的意思是,我在谷歌学者上进行了快速搜索,但没有找到与此相关的任何内容。我怎么能理解缺失值是否完全随机丢失,它们是随机丢失还是最终,它们不是随机丢失?除了研究领域我什么都想不出来。一些论文的链接表示赞赏,在此先感谢。(我将在 sas 环境中添加它,但问题与这种语言没有特别的关系)。
问问题
93 次
1 回答
0
由于您已将其标记为 SAS,因此您可以采取的一种方法是为每个分类变量创建一个布尔变量,指示它在每一行中是否有缺失值。然后,您可以使用标志对缺失值的频率进行任何您喜欢的分析。例如,您可以proc corr
用来查看一个变量的缺失值是否与其他变量的值相关。
例如,假设您有这样的情况:
data example;
set sashelp.class;
if AGE > 14 then call missing(SEX);
SEX_MISSING_FLAG = missing(SEX);
run;
然后你可以通过运行以下命令来发现它:
proc corr data = example outp= corr;
var age weight height sex_missing_flag;
run;
输出:
_TYPE_,_NAME_,Age,Weight,Height,SEX_MISSING_FLAG
MEAN,,13.32,100.03,62.34,0.26
STD,,1.49,22.77,5.13,0.45
N,,19.00,19.00,19.00,19.00
CORR,Age,1.00,0.74,0.81,0.78
CORR,Weight,0.74,1.00,0.88,0.64
CORR,Height,0.81,0.88,1.00,0.55
CORR,SEX_MISSING_FLAG,0.78,0.64,0.55,1.00
于 2014-11-24T20:47:01.230 回答