所以,我有一个看起来像的分类器
clf = VotingClassifier(estimators=[
('nn', MLPClassifier()),
('gboost', GradientBoostingClassifier()),
('lr', LogisticRegression()),
], voting='soft')
我想从本质上调整每个估计器的超参数。
有没有办法调整这些分类器的“组合”?谢谢
所以,我有一个看起来像的分类器
clf = VotingClassifier(estimators=[
('nn', MLPClassifier()),
('gboost', GradientBoostingClassifier()),
('lr', LogisticRegression()),
], voting='soft')
我想从本质上调整每个估计器的超参数。
有没有办法调整这些分类器的“组合”?谢谢
您可以使用 GridSearchCV 执行此操作,但稍作修改。在参数字典中,而不是直接指定属性,您需要使用 VotingClassfier 对象中的 classfier 键,__
然后是属性本身。
看看这个例子
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.ensemble import VotingClassifier
from sklearn.model_selection import GridSearchCV
X = np.array([[-1.0, -1.0], [-1.2, -1.4], [-3.4, -2.2], [1.1, 1.2],[-1.0, -1.0], [-1.2, -1.4], [-3.4, -2.2], [1.1, 1.2]])
y = np.array([1, 1, 2, 2,1, 1, 2, 2])
eclf = VotingClassifier(estimators=[
('svm', SVC(probability=True)),
('lr', LogisticRegression()),
], voting='soft')
#Use the key for the classifier followed by __ and the attribute
params = {'lr__C': [1.0, 100.0],
'svm__C': [2,3,4],}
grid = GridSearchCV(estimator=eclf, param_grid=params, cv=2)
grid.fit(X,y)
print (grid.best_params_)
#{'lr__C': 1.0, 'svm__C': 2}
利用GridSearchCV
clf = VotingClassifier(
estimators=[('lr',LogisticRegression()), ('gboost',GradientBoostingClassifier()),]
, voting='soft')
#put the combination of parameters here
p = [{'lr__C':[1,2],'gboost__n_estimator':[10,20]}]
grid = GridSearchCV(clf,p,cv=5,scoring='neg_log_loss')
grid.fit(X_train,Y_train)