我正在将几个分类变量和连续变量混合在一起进行回归。为了简化我的问题,我想创建一个回归模型,该模型可以预测给定某个驾驶员在不同区域的行驶里程的行驶时间。也就是说,我的训练数据中有 5 个不同的驱动程序和 2 个区域。
我知道我可能需要建立 5*2=10 的回归模型来进行预测。我在 R 中使用的是
m <- lm(driving_time ~ factor(driver)+factor(zone)+miles)
但似乎 R 并没有消耗这个组合。我的问题是是否有任何聪明的方法可以在 R 中自动进行扩展。或者我必须一个一个地编写 10 个回归模型。谢谢你。