2

我的数据:我的每小时数据中有两种季节性模式……每天和每周。例如......我的数据集中的每一天都具有基于一天中的小时的大致相同的形状。然而,像周六和周日这样的特定日子,我的数据会有所增加,而且每小时的形状也略有不同。

(使用 holt-winters,我在这里发现:https ://gist.github.com/andrequeiroz/5888967 )

我运行了算法,使用 24 作为每个季节的周期,并预测了 7 个季节(1 周),我注意到它会高估工作日和低估周末,因为它根据星期五曲线估计星期六曲线和不是星期五曲线和星期六(t-1)曲线的组合。什么是在我的数据中包含第二个时期的好方法,例如 24 和 7?他们是我应该使用的不同算法吗?

4

1 回答 1

3

解释不同形状的一种明显方法是仅使用一种周期,但使其具有 7*24 的周期,因此您将整个星期预测为一个形状。

您是否尝试过线性回归,其中预测值是线性趋势加上虚拟变量的贡献?最简单的解释是趋势加上每日贡献。那么你会有

Y = X*t + c + A*D1 + B*D2 + ... F * D6(+ 噪声)

在这里,您使用线性回归来找到 X、c 和 A...F 的最佳拟合值。t 是时间,无限期地从 0、1、2、3、... 开始计数,因此 X 的拟合值可以为您提供趋势。c 是一个常数值,因此它将所有预测的 Y 向上或向下移动。D1 在星期二设置为 1,否则设置为 0,D2 在星期三设置为 1,否则设置为 0... D6 在星期日设置为 1,否则设置为 0,因此 A..F 条款为星期一以外的日子提供捐款。我们不适合星期一的术语,因为如果我们这样做了,那么我们将无法区分 c 术语 - 如果您将 1 添加到 c 并从每个 A..F 中减去一个,则预测将保持不变。

希望您现在可以看到,我们可以添加 23 个术语来说明每天 24 小时的形状,并且总共可以添加 46 个术语来说明每个工作日的 24 小时和每个周末的不同 24 小时的形状天。

您最好寻找一个统计包来为您处理这个问题,例如免费的 R 包 ( http://www.r-project.org/ )。它确实有一些学习曲线,但是您可能会找到一些书籍或文章来指导您使用它来进行这种预测。

无论你做什么,我都会根据你的历史数据继续检查预测方法——人们发现实践中最准确的预测方法通常出奇地简单。

于 2014-09-11T05:23:37.540 回答