variable*coefficient
我正在运行 GLM,并且必须将来自我们的 IT 部门 的离散值移交给我们。
也就是说,我不确定如何使用bs()
from 函数计算分段回归模型中的斜率patsy
。
假设我有以下模型:
y ~ bs(length, degree = 1, knots = [32]
这给了我两行标准pystatsmodel
参数(系数、pvalues、标准误差等)。
这些价值观是,
variable coeff
y ~ bs(length, degree = 1, knots = [32][0] .3763
y ~ bs(length, degree = 1, knots = [32][1] .4335
我也可以这样运行它:
y ~ length + np.maximum(length-32,0)
哪个产量
variable coeff
length .0118
length -.0074
我不明白的是,当我通过这两个模型运行测试集时,它们会产生相同的预测。
在这两种情况下,我都不确定 patsy 在后台做什么,我想知道,为了回答我的问题,我应该
长度的斜率 1 应该来自系数的指数,长度的斜率 2 是指数(系数 1 + ceoff2)。如果是这种情况,该规则是否适用于这两种语法?