3

问题描述:CPU利用率预测。
方法:使用时间序列算法。

第 1 步:我从 Elasticsearch 收集了 1000 个观察结果并在 Python 上导出。

第2步:绘制数据并检查数据是否静止。

第 3 步:使用 log 将数据转换为固定形式。

第4步:完成DF测试,ACF和PACF。

第 5 步:构建ARIMA(3,0,2)模型。

第 6 步:预测。

我建立了一个ARIMA (3,0,2)时间序列模型,但无法找到模型的准确性。是否有任何命令可以让我们检查 Python 中模型的准确性?

您能否建议我的方法是否正确以及如何在 Python 中找到模型的准确性?

4

2 回答 2

1

方法正确与否——

我希望你能从 ACF 和 PACF 中找到最佳的 P、Q 值。python中有github代码可以做类似Auto Arima(自动找到最佳参数)的事情,所以你不必担心P,q值。基本上,一个模型的 BIC 最小的 P,Q 值。

Pyhton 代码-

有用于评估线性模型的三个主要指标。它们是:平均绝对误差 (MAE)、均方误差 (MSE) 或均方根误差 (RMSE)。

MAE:最容易理解的。代表平均误差

MSE:与 MAE 类似,但噪声被夸大,更大的错误被“惩罚”。它比 MAE 更难解释,因为它不在基本单位中,但是,它通常更受欢迎。

RMSE:最流行的度量,类似于 MSE,但是,结果是平方根的,以使其更易于解释,因为它是基本单位。建议将 RMSE 用作解释模型的主要指标。

下面,您可以看到如何计算每个指标。所有这些都需要两个列表作为参数,一个是您的预测值,另一个是真实值-

在此处输入图像描述

于 2018-08-03T12:11:19.953 回答
0

我一直在对此进行一些研究,不幸的是,我在 python 中找不到score与此相关的函数。statsmodels我建议按照之前帖子的回答推荐访问此站点

此外,正如答案中所述,“statsmodels 确实具有连续因变量的性能度量”。

希望一些极客会找到并回答,如果我发现任何关于此的内容,我一定会将其发布到社区。

于 2017-08-16T20:02:52.913 回答