0

关于多重共线性和多项逻辑回归的问题。我正在尝试生成一个模型,可以确定每匹马在比赛中获胜的概率。很简单,我收集的数据中有 1 表示每匹马赢或 0 输。我显然有一堆独立的变量。

我有两个高度相关的变量(~IVF 约为 12),当我将它们都包含在我的模型中时,生成的模型的 R^2 明显大于当我省略其中一个以消除共线性时。

我的问题是,考虑到我只对模型的预测能力(即每匹马赢得比赛的概率)感兴趣,而我并不真正关心分析自变量,我可以把它们留在里面吗?当我同时包含它们时,我唯一担心的是过度拟合。我应该以预测能力为代价删除一个吗?

谢谢,

蒂姆

4

0 回答 0