我正在使用超过 270,000 个观察值的跨国日常数据(我为其生成了一个年份变量),以及本次讨论中感兴趣的变量(PartyCode)的大量缺失值。数据如下所示:
Data <- data.frame(
Observation = 1:6,
PartyCountry = c("CHN", "CHN", "GER", "GER", "USA", "USA"),
Year = c(1999, 2000, 2000, 2001, 1999, 1999),
PartyCode=c(20, NA, 20, 22, NA, 21)
)
Observation PartyCountry PartyYear PartyCode
1 CHN 1999 20
2 CHN 2000 NA
3 GER 2000 20
4 GER 2001 22
5 USA 1999 NA
6 USA 1999 21
我想将此数据更改为年度数据,采用国家/地区格式:
Observation PartyCountry PartyYear PartyCode20Count PartyCode21Count PartyCode22Count
1 CHN 1999 100 100 100
2 CHN 2000 100 100 100
3 CHN 2001 300 300 300
4 GER 1999 300 300 300
5 GER 2000 140 140 140
6 GER 2001 212 212 200
我的问题是多方面的:
1)如何从分类 PartyCode 变量中提取值以生成我想要的计数变量(对于每个类别)?
值得注意的是,这个数据集有很多分类变量 PartyCode 的缺失值。