我想创建一个线性回归模型来预测使用基于数据中某个阈值的两个不同系数的输出。例如:df:
Value Temperature
8.2 70
3.2 51
5.8 54
7.2 61
等等。对于这些数据,我想弄清楚如何制作以下模型:
值 = B0 + B1(高温)+ B2(低温)
如果温度低于 55,则 B1 为 0,如果温度低于 55,则 B2 为 0。我尝试了以下操作:
fit = lm(Value ~ I(Temperature > 55), data = df)
fit2 = lm(Value ~ Temperature * I(Temperature > 55), data = df)
fit
仅在温度高于 55 时给我一个系数,并fit2
给出我不完全理解的输出。我也在考虑创建第三列,HighorLow
,带有一个指示变量(1 或 0),用于指示温度是高还是低。我会:
fit = lm(Value ~ Temperature:HighorLow, data = df)
有人有意见吗?我将不胜感激任何帮助。