如果这被记录在某处而我只是找不到它,请提前道歉:
假设我有一个时间序列数据框,如下所示:
WEEK_END_DATE TITLE_SHORT SALES
2012-02-25 00:00:00.000000 "Bob" (EBK) 1
2012-03-31 00:00:00.000000 "Bob" (EBK) 1
2012-03-03 00:00:00.000000 "Sally" (EBK) 1
2012-03-10 00:00:00.000000 "Sally" (EBK) 1
2012-03-17 00:00:00.000000 "Sally" (EBK) 1
2012-04-07 00:00:00.000000 "Sally" (EBK) 1
我想计算销售额的协方差,以便找到倾向于一起移动的用户。我知道 pandas 具有协方差功能: http: //pandas.pydata.org/pandas-docs/stable/computation.html#covariance,但我不确定如何为这种目的重塑我的数据。
我是否认为需要将用户设置为列索引,以便每个系列都是跨时间序列的向量?我不知道该怎么做。