我有一个如下所示的数据集,我想将其扩展到每月面板数据集。
ID | start_date | end_date | event_type |
1 | 01/01/97 | 08/01/98 | 1 |
2 | 02/01/97 | 10/01/97 | 1 |
3 | 01/01/96 | 12/01/04 | 2 |
有些案件比其他案件持续时间更长。我已经想出了如何通过从每个日期中提取年份然后使用以下方法将数据扩展为年度配置:
year <- ddply(df, c("ID"), summarize, year = seq(startyear, endyear))
其次是:
month <- ddply(year, c("ID"), summarize, month = seq(1, 12))
这种方法的问题在于它没有为月份分配正确的数字,即一月 = 1,因此它不能很好地与我想最终将其合并的事件数据集一起使用,我会在year
,ID
和上匹配month
。帮助将不胜感激。这是我要扩展的数据集(.xls)的直接链接:http: //db.tt/KeLRCzr9。希望我已经包含了足够的信息,但如果需要任何其他信息,请告诉我。