0

我正在构建一个包含一个因变量和十几个自变量的多元回归模型。我构建函数的原因是我需要对大约 75 个不同的数据集进行此分析。

挑战在于,当自变量在时间上滞后时,它们与因变量的相关性更好。不幸的是,并非每个变量的所有时滞都相同,我想确定每个变量的最佳时滞组合,同时为多元回归模型获得最佳调整后的 R^2 值。此外,在建立初始模型后,我将尝试使用模型step(modelbase, direction="both")上的函数来减少模型。

在我目前的方法中,我将所有自变量的时间滞后于相同的周数。这会产生所有自变量具有相同时滞的最佳模型,但我相信(有一个有效的假设支持这一点)当我们对每个自变量的时滞不同时,会有一个更好的模型。我的问题是在不增加选项数量的情况下确定最佳拟合模型的最佳策略是什么。如果我想确定 12 个自变量的每周步骤中 0 到 20 周的时间滞后,我很快就会尝试找到 4.096e+15 个变量(=20^12)之间的匹配。

我可以想象用以下策略来减少问题:首先找到一个在不同时间滞后的自变量的最佳拟合模型。第二步是添加具有不同时滞的第二个自变量,并找到具有两个自变量的最佳模型,其中第二个在不同的时滞下尝试,而第一个保持不变。然后添加第三个变量,我们采用与第二个类似的方法,保持前两个变量不变,并尝试用不同的时间滞后更改第三个变量。有些东西告诉我,这种策略可能是不错的方法,但也可能有一个更好的整体模型,其中包含每个独立变量的非最优变量。

有没有人对如何应对这一挑战有所启发?

4

0 回答 0