如果您有多个具有相同变量名称的数据集(数百个)并希望通过键合并它们,是否有一种简单的方法来控制为非键变量取哪个变量值?一种方法是在合并语句上重命名,然后编写另一个步骤来使用这些重命名的变量来计算数组中最频繁的值......但我真的想知道是否有内置的方法来处理这个问题。例如:
data ds1;
infile datalines dsd delimiter=' ';
input var1 $ var2;
datalines;
a 1
b 2
;
run;
data ds2;
infile datalines dsd delimiter=' ';
input var1 $ var2;
datalines;
a
b 2
;
run;
data ds3;
infile datalines dsd delimiter=' ';
input var1 $ var2;
datalines;
a 1
b
;
run;
data ds123;
merge ds1 ds2 ds3;
by var1;
run;
此代码将“挑选”“最右边”的 var2,即数据集 ds123:
a 1
b
但我可能希望它是:
a 1
b 2
因为这将匹配最常见的值。