这是我创建自己的模型的第一个项目。对于栖息地模型,我有 12 个可能的变量。我正在使用 glms(二项式,logit)。我想使用 VIF 检查多重共线性。我有一些变量,我将使用对数变换,一些需要二次项,一些需要与动物性别的交互项一起使用。我将通过为我的假设制作候选模型,为夏季和冬季模型选择最佳的变量组合和转换。
现在我想知道在这个过程中使用 VIF 的最聪明/标准的方法是什么:
这是一个初步分析,我只是将所有变量放入并剔除那些值超过我的阈值(VIF:3,公差:0,2)的变量,直到所有值都低于这些阈值?
或者
我是否为我的 3 个假设组的完整变量集执行此操作,并剔除值超过我的阈值的变量,直到所有值都低于阈值?
或者
在找到最佳候选模型后我会这样做吗?
此外,我不确定如何包含变换、交互项和二次项?我的变量是标准化的。我应该包括变量的这些更改还是使用纯变量(如果我将其作为初步分析,我可能不确定最终将使用哪些变量更改)?
谢谢你的帮助。