所以我试图为一个问题拟合一个二元逻辑回归模型来估计疾病的几率,这里是原始的疾病爆发数据(有 196 个观察值,我删除了一些数据条目):
第 1 列:ID(人)
第 2 栏:人的年龄
第 3 列:SES(个人的社会经济地位)(1=上层,2=中层,3=下层)
Column 4:Sect(分类:两个不同的地区)
第 5 列:Y(1=有病,0=无病)
第 6 列:储蓄(1=人有储蓄,0=没有储蓄)
1 33 1 1 0 1
2 35 1 1 0 1
3 6 1 1 0 0
...
194 31 3 1 0 0
195 85 3 1 0 1
196 24 2 1 0 0
我尝试了以下命令来拟合二元回归模型:
lm1=glm(Y~factor(Age)+factor(SES)+factor(Sect)+factor(Savings),family=binomial("logit"))
summary(lm1)
毫不奇怪,这是一团糟,因为年龄条款太多(年龄条款从 2 到 85 岁)......所以我的问题是,有人能帮我修改我的命令,以便我能够有一个年龄估计,例如,5 年或 10 年的间隔增量?
此外,上述模型不包括任何交互项。因此,如果我要考虑,比如 SES*Age 交互,并且我想查看每 5 年或 10 年的年龄估计值,我应该如何编写输入命令?