df.head().info()
RangeIndex: 5 entries, 0 to 4
Data columns (total 4 columns):
id 5 non-null object
date-hr 5 non-null object
channel 5 non-null object
hr 5 non-null int64
dtypes: int64(1), object(3)
实际日期小时看起来像
'2017-02-14--15'
id是一个字符串
我有一个像这样的df:
User-ID | Date-hr | Channel | Hr
U1 D1-10 C1 10
U1 D1-11 C2 11
U1 D1-10 C1 10
U1 D1-10 C3 10
U1 D1-10 C1 10
U1 D1-11 C3 11
U1 D1-11 C2 11
..
当我应用以用户 ID 为索引和列为的枢轴操作时
['date-hr', 'channel']
使用count作为聚合函数。
我为每个用户获得 1 行,主索引为 date-hr,所有频道都在该 date-hr 值下,例如:
D1-10 D1-11 .....
C1 C3 C2 C3 .....
U1 3 1 2 1 .....
现在我需要的是每个“日期小时”下的最大频道数
D1-10 D1-11 .....
C1 C2 .....
U1 (C1,3) (C2,2) .....
我无法弄清楚如何从我的数据中获得这种转换。