我有一个数据集,其中包含由不同的人/仪器做出的一系列不同维度的读数。它看起来像这样:
SUBJECT DIM1_1 DIM1_2 DIM1_3 DIM1_4 DIM1_5 DIM2_1 DIM2_2 DIM2_3 DIM3_1 DIM3_2
1 1 . 1 1 2 3 3 3 2 .
2 1 1 . 1 1 2 2 3 1 1
3 2 2 2 . . 1 . . 5 5
... ... ... ... ... ... ... ... ... ... ...
我的真实数据集包含大约 190 个维度,每个维度最多包含 5 个度量
我必须遵守一组规则来为每个维度创建一个新变量:
- 如果同一维度中有 2 个不同的值(不包括缺失值),则新变量为缺失值。
- 如果所有值都相同(排除缺失值),则新变量采用相同的值。
我的新变量应如下所示:
SUBJECT ... DIM1_X DIM2_X DIM3_X
1 ... . 3 2
2 ... 1 . 1
3 ... 2 1 5
这里的问题是我对每个维度没有相同数量的度量。另外,我只能想出很多 IF(我的意思是很多,因为给定维度中的更多度量会增加比较次数),所以我想知道是否有一些更简单的方法来处理这个特定问题。
任何帮助将不胜感激。提前致谢。