我有一个类似于以下文件的数据集
2013-05-30 06:00:41 173.199.116.171
2013-05-30 06:05:41 61.245.172.14
2013-05-30 06:10:42 74.86.158.106
2013-05-30 06:20:42 61.245.172.14
我想重新采样 20 分钟并获得某个 20 分钟时间段的命中数。(例如,在(06.00.00-06.20.00 或 06.40.00-07.00.00 等)之间。我可以打印命中数整个数据文件如下。
ips = df.groupby('IP').size()
如何获取每 20 分钟插槽的命中数?以下代码仅打印“06:00:00”和“06:20:00”之间的所有 IP。
df_s = df['IP'].resample('20t', how='count')
print df['IP'].between_time('06:00:00', '06:20:00')