2

我目前正在使用该库构建 ARIMAX 模型pmdarima

pmdarima.pipeline.Pipeline.fit(y, exogenous=None, **fit_kwargs)

参数说明:

外生:类数组,形状=[n_obs,n_vars],可选(默认=无)

一个可选的二维外生变量数组。如果提供,这些变量将用作回归操作中的附加特征。这不应包括常数或趋势。请注意,如果 ARIMA 适合外生特征,则必须为其提供外生特征以进行预测。

但我不明白这种格式是什么意思:shape=[n_obs, n_vars]

n_obs和的含义是n_vars什么?

为什么我们需要这种格式而不是时间序列格式的外生变量?

4

1 回答 1

1

泰勒史密斯先生给我发了一封电子邮件:

外生变量或协变量在大多数 ML 算法中呈现为二维矩阵,我相信您知道。沿行轴是观察值,沿列轴是变量或特征向量(因此n_samplesx n_features)。您所询问的约定是 Numpy 和 scikit-learn 用于表示类似数组的对象的形状的约定(例如,参见 scikit-learn 套索的文档)。shape=[n_obs, n_vars]简单地表示一个二维矩阵,样本沿行,变量沿列。

至于你为什么不能使用时间序列的问题......你的y变量应该是一个时间序列(实际上只是一个向量,或一维数组),因为这就是你要预测的。这是唯一需要的数据。外生变量纯粹是可选的补充数据。

于 2019-05-07T15:04:15.167 回答