关于在我正在使用的季度 Pandas DataFrame 中创建 Dummies,我基本上有 3 个相关问题。第一个是:如何创建一个“虚拟”变量,将每个公司 ID 的最后四个季度设置为 1?我想产生如下相同的结果:
Firm Quarter Dummy
A 2017-03-31 1
A 2016-12-31 1
A 2016-09-30 1
A 2016-06-30 1
A 2016-03-31 0
A 2015-12-31 0
A 2015-09-30 0
A 2015-06-30 0
A 2015-03-31 0
B 2009-06-30 1
B 2009-03-31 1
B 2008-12-31 1
B 2008-09-30 1
B 2008-06-30 0
B 2008-03-31 0
B 2007-12-31 0
B 2007-09-30 0
B 2007-06-30 0
.
.
.
Z . .
Z . .
Z . .
我的第二个问题是:如何创建一个“虚拟”变量,将四个季度设置为 1,最后一个季度后一年(给定每个公司最后一个季度的不同日期)?如下面的DataFrame:
Firm Quarter Dummy
A 2017-03-31 0
A 2016-12-31 0
A 2016-09-30 0
A 2016-06-30 0
A 2016-03-31 1
A 2015-12-31 1
A 2015-09-30 1
A 2015-06-30 1
A 2015-03-31 0
B 2009-06-30 0
B 2009-03-31 0
B 2008-12-31 0
B 2008-09-30 0
B 2008-06-30 1
B 2008-03-31 1
B 2007-12-31 1
B 2007-09-30 1
B 2007-06-30 0
.
.
.
Z . .
Z . .
Z . .
最后,关于上一张表,我如何摆脱第一个 Dummy = 1 之前的前四个季度(Dummy = 0),并在每个公司 ID 的最后一个 Dummy = 1 之后保留 dummy = 0 的季度?,得到一个最终的DataFrame,如下所示:
Firm Quarter Dummy
A 2016-03-31 1
A 2015-12-31 1
A 2015-09-30 1
A 2015-06-30 1
A 2015-03-31 0
B 2008-06-30 1
B 2008-03-31 1
B 2007-12-31 1
B 2007-09-30 1
B 2007-06-30 0
.
.
.
Z . .
Z . .
Z . .
非常感谢您的帮助!!