0

我的数据集如下所示:

国家 贫困率 销售量
奥地利 1950 0.54 142
奥地利 1951年 0.32 12441
奥地利 1952年 0.32 12441
孟加拉国 1950 0.11 142123123
孟加拉国 1951年 0.52 1234
孟加拉国 1952年 0.32 12441
斯里兰卡 1950 0.95 4215
斯里兰卡 1951年 0.21 142421
斯里兰卡 1952年 0.32 12441

我想这样做tsset,以便我可以(例如)为每个国家/地区每年的销售额变化创建一个新变量。当我尝试这样做时tsset country year,我看到“面板内的重复时间值”。如何创建一个新变量,即每个国家和每年的销售额变化?我有更多变量,所以我希望能够指定变量。

4

1 回答 1

0

country从这里看起来像一个字符串变量,但如果是的话

 tsset country year 

会因为这个原因而失败。所以,假设country是一个带有值标签的数字变量。然后有必要用say来跟进重复观察的报告

 duplicates list country year 

 duplicates tag country year, gen(tag) 

 edit if tag 

然后下一步取决于您所看到的,例如:

  1. 重复项只是其中一个变量缺少值的垃圾。drop垃圾。

  2. 意外重复观察。drop重复项。

  3. 更严重的事情。

另请参阅常见问题解答https://www.stata.com/support/faqs/data-management/repeated-time-values/

于 2022-01-18T16:23:17.023 回答