作为能够计算两个日期时间之间的活动的后续问题,在这里很好地回答:创建一个包含跨越日期范围的项目计数的 Pandas 数据框
剩下的问题是最后一个月 ['END_DATE'] 在两个表相加和相减后最终显示为零,这在数学上是正确的,因为所有项目的结束日期都在当月或更早,但是在这种情况下,因为他们在那个月至少有一部分是活跃的,将一个月添加到 END_DATE 会更正确,这样他们将在结束月份显示为活跃(H2 是一个数据框)
代码是:
ends = H2['END_DATE'].apply(lambda t: t.to_period(freq='m')).value_counts()
我曾尝试使用前滚和 DateOffset(month=1) 例如。对于日期偏移:
ends = (H2['END_DATE'].DateOffset(months=1)).apply(lambda t: t.to_period(freq='m')).value_counts()
这给了我这个错误:
AttributeError: 'Series' object has no attribute 'DateOffset'