问题标签 [multicollinearity]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 Sklearn 模拟多重共线性?
我想看看多重共线性对线性回归模型有什么影响,但我需要能够生成多重共线性数据,我可以在其中改变特征的数量和这些特征之间的共线性。
我看过 Sklearn 的make_regression
功能,它允许生成多个功能,但据我了解,这些功能都是不相关的,正确吗?
如果是这样,有谁知道我如何改变这些特征之间的相关性或使用不同的方法来生成线性多共线数据集来训练 Sklearn 的线性回归模型?
r - 使用 R 中的固定效应模型检查多重共线性
来自德国社区的 Guten Tag :)
我正在处理时间和公司的面板数据和固定效果(= FE)。我想通过使用方差膨胀因子(= VIF)来检查我的模型的多重共线性,但是 R 给了我一个警告消息而不是输出。
我如何解释此警告消息,是否有解决方案?
我想过自己计算VIF:
这是在解决问题吗?
当没有 FE 时,如何像以前一样为每个变量获取 VIF?
提前致谢!:)
代码 1:
结果 1:
R平方:0.26632
代码 2:
结果 2:
数据:
r - 何时使用 VIF 检测 GLM 中变量的多重共线性以及如何处理转换后的变量?
这是我创建自己的模型的第一个项目。对于栖息地模型,我有 12 个可能的变量。我正在使用 glms(二项式,logit)。我想使用 VIF 检查多重共线性。我有一些变量,我将使用对数变换,一些需要二次项,一些需要与动物性别的交互项一起使用。我将通过为我的假设制作候选模型,为夏季和冬季模型选择最佳的变量组合和转换。
现在我想知道在这个过程中使用 VIF 的最聪明/标准的方法是什么:
这是一个初步分析,我只是将所有变量放入并剔除那些值超过我的阈值(VIF:3,公差:0,2)的变量,直到所有值都低于这些阈值?
或者
我是否为我的 3 个假设组的完整变量集执行此操作,并剔除值超过我的阈值的变量,直到所有值都低于阈值?
或者
在找到最佳候选模型后我会这样做吗?
此外,我不确定如何包含变换、交互项和二次项?我的变量是标准化的。我应该包括变量的这些更改还是使用纯变量(如果我将其作为初步分析,我可能不确定最终将使用哪些变量更改)?
谢谢你的帮助。
r - 使用 findCorrelation () 函数执行共线性时出错(创建 SDM)
我正在尝试使用存在-不存在方法创建一个物种分布模型(SDM)。我已经完成了所有必要的步骤(在感兴趣的物种之一的完整代码下方)。为此,我从 WorldClim 下载了 19 个生物气候变量,并制作了欧洲(不包括俄罗斯)的作物。但是我需要做共线性来排除相关变量。问题是当我去搜索相关性时,它返回一个空数据框(数据不可用)(空数据框是代码末尾的“Vars_to_removemin”)。我已经使用了这些代码并且它们没有给我造成任何问题,有没有人知道一种以不同方式执行数据共线性的方法,或者他们知道为什么给我这个错误?以下是完整且完全可复现的代码(复现 5 分钟。