我有需要收集总和和唯一计数统计信息的数据。数据的粗略格式如下以 CSV 格式输入:
Customer PartType 2011 2012 2013
A widget_b 1000 10000 20000
B widget_a 1 1000 5000
....
我需要能够按客户(没有 PartType)汇总此表,并按 YEAR 对大小箱中的客户进行总和和计数,以及按年份按 PART_TYPE 计算客户的相同练习。
几个问题:
1) 有没有一种简单的方法可以使用 pandas 制作如下所示的数据框:
Customer PartType Year value
A widget_b 2011 1000
A widget_b 2012 10000
....
我想我可以用 pandas.pivot_table 做到这一点,但结果是 groupby 无法轻松处理的奇怪数据类型。
2) 有没有一种简单的方法可以在客户大小的桶内按年生成总和和计数?我在 groupby 方法中使用了 pd.cut ,它一次只生成一年的总和或计数,因此当您打印其他年份的结果时,它们完全相同。