0

我使用“vars”R 包进行多变量时间序列分析。问题是当我进行双变量 VAR 时,serial.test() 的结果总是给出非常低的 p 值,因此我们拒绝 H0 并且残差是相关的。正确的做法是增加 VAR 的阶数,但即使阶数非常高(p=20 甚至更多),我的残差仍然是相关的。这怎么可能 ?

我真的不能给你一个可重现的代码,因为我不知道如何重现一个残差总是相关的 VAR。对我来说,这是一个非常不寻常的情况,但如果有人知道这是怎么可能的,那就太好了。

4

1 回答 1

2

对于Cross Validated来说,这可能是一个更好的问题,因为它不包含任何 R 代码或可重现的示例,但您可能需要进行比“我的 p 值低”更多的挖掘工作。您是否测试过数据的正常性?还有,要说

正确的做法是增加VAR的阶数

非常不准确。您正在处理哪种类型的数据,您会设置高达 20 的滞后顺序?年度数据的典型值为 1,季度为 4,月度数据为 12。您不能只对您的问题提出越来越高的命令,并期望它能够解决基础数据中的问题。

假设您有一个最佳滞后值,并且您的数据是正态分布的,并且您的 p 值仍然很低,那么有几种方法可以走。

较小的正序列相关情况(例如,0.2 到 0.4 范围内的 lag-1 残差自相关,或 1.2 到 1.6 之间的 Durbin-Watson 统计量)表明模型中有一些微调空间。考虑添加因变量的滞后和/或一些自变量的滞后。或者,如果您的统计软件中有可用的 ARIMA+regressor 过程,请尝试将 AR(1) 或 MA(1) 项添加到回归模型中。AR(1) 项在预测方程中增加了因变量的滞后,而 MA(1) 项则增加了预测误差的滞后。如果在滞后 2 处存在显着相关性,则二阶滞后可能是合适的。

如果残差中存在显着的负相关(lag-1 自相关比 -0.3 更负或 DW stat 大于 2.6),请注意您可能对某些变量进行了过度差分。差异往往会在负方向上驱动自相关,而过多的差异可能会导致滞后变量无法纠正的人为负相关模式。

如果在季节性期间存在显着相关性(例如,季度数据的滞后 4 或月度数据的滞后 12),这表明模型中没有正确考虑季节性。可以通过以下方式之一在回归模型中处理季节性:(i) 对变量进行季节性调整(如果它们尚未进行季节性调整),或 (ii) 使用季节性滞后和/或季节性差异变量(注意:小心不要过度差异!),或 (iii) 在模型中添加季节性虚拟变量(即一年中不同季节的指标变量,例如 MONTH=1 或 QUARTER=2 等)。虚拟变量方法可实现加性季节性作为回归模型的一部分进行的调整:可以为一年中的每个季节估计不同的附加常数。如果已记录因变量,季节性调整是乘法的。(需要注意的其他事项:尽管您的因变量可能已经进行了季节性调整,但您的一些自变量可能不是,导致它们的季节性模式泄漏到预测中。)

序列相关的主要案例(Durbin-Watson 统计远低于 1.0,自相关远高于 0.5)通常表明模型中存在基本结构问题。您可能希望重新考虑已应用于因变量和自变量的转换(如果有)。它可能有助于通过适当的差分、记录和/或放气组合来平稳化所有变量。

于 2015-08-03T15:23:19.263 回答