我想知道我是否可以在 xgboost 中进行校准。更具体地说,xgboost 是否带有像 scikit-learn 中的现有校准实现,或者是否有一些方法可以将 xgboost 中的模型放入 scikit-learn 的 CalibratedClassifierCV?
据我在 sklearn 中所知,这是常见的程序:
# Train random forest classifier, calibrate on validation data and evaluate
# on test data
clf = RandomForestClassifier(n_estimators=25)
clf.fit(X_train, y_train)
clf_probs = clf.predict_proba(X_test)
sig_clf = CalibratedClassifierCV(clf, method="sigmoid", cv="prefit")
sig_clf.fit(X_valid, y_valid)
sig_clf_probs = sig_clf.predict_proba(X_test)
sig_score = log_loss(y_test, sig_clf_probs)
print "Calibrated score is ",sig_score
如果我将 xgboost 树模型放入 CalibratedClassifierCV 会引发错误(当然):
RuntimeError: classifier has no decision_function or predict_proba method.
有没有办法将 scikit-learn 的优秀校准模块与 xgboost 集成?
欣赏你有见地的想法!