我有一个小问题,我被困住了。我正在使用 Python statsmodels 构建多项 logit 模型,并希望重现教科书中给出的示例。到目前为止一切顺利,但我正在努力将不同的目标值设置为回归的基值。有人可以帮忙吗?!
import numpy as np
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
#import data
df = pd.read_excel('C:/.../diabetes.xlsx')
#split the data in dependent and independent variables
y = df['CC']
X = df.drop(['Patient', 'CC'], axis = 1)
Xc = sm.add_constant(X)
#instantiate and fit multinomial logit
mlogit = sm.MNLogit(y, Xc)
fmlogit = mlogit.fit()
print(fmlogit.summary())
因此,“CC”列是目标变量,包含糖尿病状态的编码:
CC = 1 -> 明显糖尿病,CC = 2 -> 化学性糖尿病,CC = 3 -> 正常
现在,默认情况下 CC = 1 是基值,但是,我希望 CC = 3 作为我的基值。这是我的回归输出。
有人知道吗?
提前非常感谢,ig