0

我正在阅读“统计学习简介”,并且已经到了讨论线性回归的交互项的章节(第 3.3.2 节)。我了解添加交互项的好处以及设置交互项的理论。但是,目前尚不清楚如何在 python 中进行设置。

通过在线阅读,我了解到 sklearn 上的 PolynomialFeatures 可用于使用 interaction_only 参数创建交互项。

但是,我不确定进行线性回归的下一步。我拥有的数据是连续变量。

我的问题是:

  1. 我可以通过将度数设置为 1(在 PolynomialFeatures 上)然后应用 fit_transform 方法来执行线性回归吗?或者我是否必须将度数设置为 2(最小值),因为我正在选择多项式线性回归?例如,直线可能比二次曲线更适合模型

  2. 如果有 4 个预测变量(x1、x2、x3、x4)并且交互作用仅在 x2 和 x3 之间,如何添加交互项

注意:本书提供了一个将回归应用于直线(而不是多项式)的示例。

4

0 回答 0