问题标签 [sarimax]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 当我运行 Arima/Sarima 模型时出现错误 - 输入类型不支持 ufunc 'isnan' 或 numpy cast 上的 Panda
我正在以百分比构建 ARIMA/Sarima 模型,但出现以下错误 1-
model = SARIMAX(np.asarray(train), order = (0, 1, 1), seasonal_order =(1, 1, 1, 12))
TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe''
2-如果我不将 pandas 数据框转换为 numpy 数组,我会收到以下错误
model = SARIMAX(train, order = (0, 1, 1), seasonal_order =(1, 1, 1, 12))
ValueError: Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).
尽管几天前我在步骤 2 中使用的相同代码正在运行
machine-learning - 是否存在可以具有与 SARIMAX 相同的外生因素的 LSTM 模型?
我已经和 SARIMAX 合作了一段时间。我试图预测大型建筑物的能源使用情况。我使用天气数据作为外生变量。正如我从天气预报中知道的预测天气一样,我也在预测中使用了这些数据。我尝试用 1 小时的采样时间来预测前一天,所以 t_1 -> t_24。
是否存在任何可以在预测中使用输入的 LSTM/RNN,比如天气预报?
例子:
数据 0 < t 用作训练数据。想要预测 t > 0 的 X。
python - 管道 auto_arima/SARIMAX
我想使用 auto_arima 因为我想要 SARIMAX 并且我希望它选择最好的参数。我的代码实际上是通过一堆不同的组合运行(因为它正在预测多个项目)并且它通过多个模型运行,因此最后我可以为每个组合选择“最佳”模型。我已经处理过它,在代码的前面创建了所有正确的组合(使用字典等),但是有没有办法从逐步模型中输出每个组合的最佳参数,以便它自动适合那些“最佳”参数?我知道您通常可以手动输入最佳参数,然后“拟合”模型,但有没有办法自动化?
代码是可以理解的。它在这中间产生这个最终导致这个错误 -
python - Sarimax 内生和外生变量 - 前提是外生值的形状不合适
我遇到的问题是使用SARIMAX
模型和 2 个变量在 python 中预测时间序列的一种相当简单的方法:
- 内生的:感兴趣的。
- 外生的:假设对内生变量有一些影响。
该示例使用 BTC 和 ETH 的每日价值,其中 BTC 是内生的,ETH 是内生的。
使用 yahoo.finance API 获取数据的方法非常简单yf
这需要手动完成 - 手动插入硬币的名称(在组合硬币方面为用户提供更多自由)。
我们的外生数据df1
也是如此。然后以相同的方式获取内生数据。
现在是两个数据集对齐的合并步骤。
看起来像这样:
我只想关注 BTC 和 ETH 的收盘价:
寻找最佳网格:
做出预测
但是当我尝试根据 做出未来预测时exo
,如下所示:
我收到这个烦人的错误:
有人可以解释我错在哪里或者我在这个模块中错过了哪些步骤吗?
python - Python - Sarima/Sarimax - 为多个预测创建输出表
我目前正在做一个项目,我不太确定如何最好地实施下一步,所以我很感激建议和反馈。
在我的数据中,某个日期可能会出现多次,因为我通过邮政编码预测销售额。 数据结构示例 其背景是我想将天气添加到邮政编码中。事后检查不同的天气参数是否可以更好地预测我的模型(SARIMA/SARIMAX)。之后我想在一个表格中有一个输出,其中所有邮政编码都存储了预测的 RMSE。如果 auto_arima 为此选择了参数也很好。
然后我会比较 SARIMA 和 SARIMAX 之间的这些,以便我可以检查有多少百分比的预测通过外部数据变得更好。
目前,数据位于包含 60 多个邮政编码的表中。有没有人有一个想法或功能可以用来创建多个模型(每个邮政编码和选定的参数)和表格?
我现在已经阅读了一些关于金字塔的东西,但我不太确定这是否是正确的包,无论如何我都找不到类似的例子。
performance - 跨多个模型的时间序列步骤比较
目前我正在处理不同模型的时间序列问题。我将数据集分成 80% 的训练和 20% 的测试。数据是每天汇总的,而不是我每周汇总然后每月汇总。
我的问题是在测试数据的不同部分评估 RMSE 是否有意义? 因此,在这个图 上,我对整个测试集(65)点进行了 ARIMA 每周预测并评估了 RMSE。例如,查看前 10 个步骤的 RMSE 是否有意义?情节仍然相同,但我正在查看前 10 个步骤,而不是整个 65 个步骤。
然后对 LSTM 等其他模型做同样的事情?
python - 如何在 Python 中使用 SARIMAX 从预测值中减去真值?
当我从预测值中减去真值时,我得到了 NaN 值。我不明白为什么这不起作用。这是我的代码和下面的输出。输出显示无法减去这些值,但我不知道为什么。
python - SARIMAX 中置信区间的大正数或负数
我使用 SARIMAX 模型来预测时间序列数据。但是对于某些输入,结果很奇怪!例如,预测值为 25,727,但其对应的置信区间为 (-12,446,499, 12,499,006)!!!我的模型有什么问题?这些数字的含义是什么?
r - ARIMA 建模运行时间问题
我的数据集是包含两个变量 Production 和 Shipment 的每周数据。产量是自变量,出货量是因变量。首先,我试图预测 Production 值并将其用作预测 Shipment 变量的回归量。
如果我使用训练集日期范围 From-> "2018-12-31" To-> "2021-11-22" 运行 Arima,模型将在 10 分钟内运行,我可以看到模型值。
使用相同的模型,如果我将训练集数据范围从-“2018-12-31”扩展到->“2021-12-27”,只要模型从未完成模型执行,模型就会运行,我无法查看模型输出。
你能帮我解决这个问题吗?谢谢你的支持
在上述模型 2 上,从未完全执行,模型仍在运行。
从上面可以看出,模型 1 和模型 2 除了训练数据之外没有任何区别,所以请您告诉我这里缺少什么。谢谢