我目前正在使用 MATLAB 的LinearModel.fit
函数运行多元线性回归,对于如何手动将交互项正确添加到模型中,我有点困惑。据我所知,LinearModel.fit
它本身并没有标准化变量,所以我一直在手动进行。
到目前为止,我的做法是
- 标准化每个变量的观察值
- 将特定变量的相应标准化值相乘以创建交互项,然后将这些新变量添加到回归数据集中
- 运行回归
这是正确的方法吗?在计算“原始”项之后,我是否也应该标准化交互项变量?任何帮助将不胜感激!
我目前正在使用 MATLAB 的LinearModel.fit
函数运行多元线性回归,对于如何手动将交互项正确添加到模型中,我有点困惑。据我所知,LinearModel.fit
它本身并没有标准化变量,所以我一直在手动进行。
到目前为止,我的做法是
这是正确的方法吗?在计算“原始”项之后,我是否也应该标准化交互项变量?任何帮助将不胜感激!
是否标准化交互项可能取决于您打算对模型做什么。标准化通常不会影响模型性能,因为它允许更直接的模型解释,因为您学习的系数将在相似的范围内。我怀疑是否这样做在很大程度上是一个见仁见智的问题。这是一个相关的 stats.stackexchange 帖子,可能会有所帮助。
我的直觉与您迄今为止描述的过程相同。