0

你能给我一些提示来识别分类变量缺失值的缺失性质吗?我的意思是,我在谷歌学者上进行了快速搜索,但没有找到与此相关的任何内容。我怎么能理解缺失值是否完全随机丢失,它们是随机丢失还是最终,它们不是随机丢失?除了研究领域我什么都想不出来。一些论文的链接表示赞赏,在此先感谢。(我将在 sas 环境中添加它,但问题与这种语言没有特别的关系)。

4

1 回答 1

0

由于您已将其标记为 SAS,因此您可以采取的一种方法是为每个分类变量创建一个布尔变量,指示它在每一行中是否有缺失值。然后,您可以使用标志对缺失值的频率进行任何您喜欢的分析。例如,您可以proc corr用来查看一个变量的缺失值是否与其他变量的值相关。

例如,假设您有这样的情况:

data example;
    set sashelp.class;
    if AGE > 14 then call missing(SEX);
    SEX_MISSING_FLAG = missing(SEX);
run;

然后你可以通过运行以下命令来发现它:

proc corr data = example outp= corr;
    var age weight height sex_missing_flag;
run;

输出:

_TYPE_,_NAME_,Age,Weight,Height,SEX_MISSING_FLAG
MEAN,,13.32,100.03,62.34,0.26
STD,,1.49,22.77,5.13,0.45
N,,19.00,19.00,19.00,19.00
CORR,Age,1.00,0.74,0.81,0.78
CORR,Weight,0.74,1.00,0.88,0.64
CORR,Height,0.81,0.88,1.00,0.55
CORR,SEX_MISSING_FLAG,0.78,0.64,0.55,1.00
于 2014-11-24T20:47:01.230 回答