-1

我有多年的横截面数据。有一个唯一标识符,表示每个横截面中常见的特定人。但是,每年都会增加新的人(有些人死了,因此不会在晚年)

我想知道如何在 Stata 中合并这些数据集以创建一种面板。

例子:

    ID X_2005 Y_2005
    1    700    850
    2    400    311
    3    475    250


   ID  X_2006 Y_2006
   2     425    325
   3     500    250
   4     465    200

我要这个:

  ID X_2005 Y_2005 X_2006 Y_2006
  1    700    850        
  2    400    311    425   325
  3    475    250    500   250
  4                  465   200

我试过查看 Stata 的merge命令,但我不明白 1:m、m:m 等。似乎每个数据集中的标识符数量必须相同,所以我很困惑。

4

1 回答 1

1

正如@Nick Cox 已经指出的那样,您的示例是 1:1 的简单案例merge,使用变量ID来匹配两个横截面中的观察结果:

clear
input ID X_2005 Y_2005
1    700    850
2    400    311
3    475    250
end

save year2005, replace

clear
input ID X_2006 Y_2006
2     425    325
3     500    250
4     465    200
end

save year2006, replace

use year2005
merge 1:1 ID using year2006

Result                           # of obs.
-----------------------------------------
not matched                             2
    from master                         1  (_merge==1)
    from using                          1  (_merge==2)

matched                                 2  (_merge==3)
-----------------------------------------


list ID  X_2005 Y_2005 X_2006  Y_2006

   +----------------------------------------+
   | ID   X_2005   Y_2005   X_2006   Y_2006 |
   |----------------------------------------|
1. |  1      700      850        .        . |
2. |  2      400      311      425      325 |
3. |  3      475      250      500      250 |
4. |  4        .        .      465      200 |
   +----------------------------------------+
于 2018-04-12T12:34:58.170 回答