我有一个 R 数据框,它描述了产品销售的演变。每季度有 2000 家商店,有 5 列(即 5 个时间段)。我想知道如何用 R 分析它。
我已经试着做了一些基本的分析,就是先确定第1期、第2期等的平均销售额,然后确定每个期的平均数,然后比较每个店铺的相对演变情况这种普遍的演变。例如,第一期总共有 50 000 个销售额,第 5 期总共有 35 000 个销售额,所以我假设每个商店在第 5 期的正常销售额是 35/55=0.63*第 1 期的金额period's sale:如果店铺X在第一期卖出了100件,我假设它在第五期正常应该卖出63件。
显然,这是一种容易做到的方法,但在统计上并不相关。
我想要一种方法,使我能够确定最小化我的 R 方的趋势抑制。我的目标是能够通过中和总体趋势来分析商店的销售额:我想通过统计上正确的方法准确地知道哪些是表现不佳的商店,哪些是表现出色的商店。
我的数据框的结构是这样的:
shopID | sum | qt1 | qt2 | qt3 | qt4 | qt5
000001 | 150 | 45 | 15 | 40 | 25 | 25
000002 | 100 | 20 | 20 | 20 | 20 | 20
000003 | 500 | 200 | 0 | 100 | 100 | 100
... (2200 rows)
我试图将我的时间序列放在一个成功的列表中,具有以下功能:
reversesales=t(data.frame(sales$qt1,sales$qt2,sales$qt3,sales$qt4,sales$qt5))
# I reverse rows and columns of the frame in order that the time periods be the rows
timeser<-ts(reversesales,start=1,end=5, deltat=1/4)
# deltat=1/4 because it is a quarterly basis, 1 and 5 because I have 5 quarters
尽管如此,我还是无法对这个变量做任何事情。我不能做任何情节(使用“情节”功能),因为有 2200 行(所以 R 想让我连续绘制 2200 个情节,显然这不是我想要的)。
另外,我不知道如何确定每个商店每个时期的销售的理论趋势和理论值......
谢谢您的帮助!(和圣诞快乐)