对 python 和机器学习很陌生。
我正在尝试建立一个逻辑回归模型。我曾在 R 中工作以获得 lambda,并使用交叉验证来找到最佳模型,现在正在将其移至 python。
在这里,我创建了一个设计矩阵并使其稀疏。然后运行逻辑回归。它似乎正在工作。
我的问题是,既然我已经说过我的术语 item_number 是一个类别,我怎么知道哪个已成为虚拟变量?我怎么知道每个类别名称对应的系数?
from patsy import dmatrices
from sklearn.linear_model import LogisticRegression
from sklearn import preprocessing
def train_model (data, frm, Rlambda):
y, X = dmatrices(frm , data, return_type="matrix")
y = np.ravel(y)
scaler = sklearn.preprocessing.MaxAbsScaler(copy=False)
X_trans = scaler.fit_transform(X)
model = LogisticRegression(penalty ='l2', C=1/Rlambda)
model = model.fit(X_trans, y)
frm = 'purchase ~ price + C(item_number)'
Rlambda = 0.01
model, train_score = train_model(data1,frm,Rlambda)