我有一个包含四列的大量数据框,其中两列是“日期”(datetime
格式)和“页面”(保存为的位置string
)。我已按“页面”对数据框进行分组并调用它pagegroup
,并且想知道访问每个页面的时间范围(例如,第一次访问是在 1-1-13,最后一次访问是在 1-5-13,所以最大-最小为 5 天)。
我知道在熊猫中我可以date_range
用来比较两个日期时间,但尝试类似:
pagegroup['date'].agg(np.date_range)
返回
AttributeError: 'module' object has no attribute 'date_range'
在尝试简单(非特定日期)numpy 函数时ptp
,我给出了一个整数答案:
daterange = pagegroup['date'].agg([np.ptp])
daterange.head()
ptp
page
%2F 0
/ 13325984000000000
/-509606456 297697000000000
/-511484155 0
/-511616154 0
谁能想到一种方法来计算日期范围并让它以可识别的日期格式返回?
谢谢