我有一个包含以下前三列的数据集。包括购物篮 ID(唯一标识符)、销售金额(美元)和交易日期。我想为数据集的每一行计算以下列,我想在 Python 中计算它。
同一篮子的先前销售(如果有);当前购物篮的销售计数;当前篮子的平均日期(如果有);当前购物篮的最大截止日期(如果有)
Basket Sale Date PrevSale SaleCount MeanToDate MaxToDate
88 $15 3/01/2012 1
88 $30 11/02/2012 $15 2 $23 $30
88 $16 16/08/2012 $30 3 $20 $30
123 $90 18/06/2012 1
477 $77 19/08/2012 1
477 $57 11/12/2012 $77 2 $67 $77
566 $90 6/07/2012 1
我对 Python 很陌生,我真的很难找到任何东西来以一种奇特的方式来做这件事。我已经按 BasketID 和 Date 对数据(如上)进行了排序,因此我可以通过为每个篮子向前移动一个来批量获得先前的销售。除了循环之外,不知道如何以有效的方式获取 MeanToDate 和 MaxToDate ......有什么想法吗?