我有一个要求在下面做。
我有一张sales
表格,其中包含几个产品项目(ABC1、ABC2、...、ABC7)的过去一年的销售数据。
Invoice Number Date Product ID Sales
........ ......... .... ..
IN000945 1/01/2019 ABC1 2
IN000946 2/01/2019 ABC2 4
IN000947 2/01/2019 ABC1 6
IN000948 4/01/2019 ABC1 1
IN000949 4/01/2019 ABC1 9
IN000950 4/01/2019 ABC3 10
IN000951 4/01/2019 ABC6 1
IN000952 8/01/2019 ABC2 12
IN000953 9/01/2019 ABC2 3
........ ......... .... ..
IN567953 31/12/2019 ABC7 12
........ ......... .... ..
要求 我想创建一个包含以下数据的表。它将用于训练模型。
- 我只想要来自 ABC1、ABC2 和 ABC3 产品的记录。
- 在过去一年的日期范围内,我想选择 160 个随机日期(例如)并计算以下内容。
- 从随机日期开始,计算过去一周的数据、过去 4 周的数据和未来 4 周的数据。
数据始终可用于为任何边缘日期生成汇总数据。例如,2019 年 12 月 31 日。在分析中,我们只对计算过去一年的数据感兴趣。
我不想从表中的日期中获取随机日期。相反,我想从过去一年的所有可能的 365 个日期中生成随机日期,即使该日期没有特定记录。对于给定的日期,我想要所有 3 种产品的汇总数据。因此,对于给定的日期,将有 3 条记录,如最终输出表所示。
决赛桌看起来与此类似。
Date Product Past week Past 4 week Future 4 week
4/03/2019 ABC1 12 34 34
4/03/2019 ABC2 11 52 24
4/03/2019 ABC3 6 23 45
8/06/2019 ABC1 15 34 32
8/06/2019 ABC2 13 45 65
8/06/2019 ABC3 12 56 34
14/09/2019 ABC1 12 65 32
14/09/2019 ABC2 14 12 26
14/09/2019 ABC3 12 76 31
.......... .... .. .. ..
12/10/2019 ABC3 15 34 25
我不知道如何解决这个问题。谢谢您的帮助。