我正在Stata中将两个数据集合并在一起,并提出了一个潜在的问题。
我计划在sort
两个数据集共有的几个分类变量上以完全相同的方式对每个数据集进行处理。然而,几个分类变量在一个数据集中存在的类别比另一个数据集中的类别多。我已经足够小心以确保两个数据集的编码匹配(例如,红色在数据集 A 和 B 中都编码为 1,但数据集 A 只有红色、绿色和蓝色,而数据集 B 有红色、绿色、蓝色和黄色)。
如果我对sort
每个数据集以相同的方式和generate
一个id
变量 ( gen id = _n
)merge
进行处理,我会遇到任何问题吗?