7

我想看看精度和召回率如何随阈值而变化(不仅仅是彼此)

model = RandomForestClassifier(500, n_jobs = -1);  
model.fit(X_train, y_train);  
probas = model.predict_proba(X_test)[:, 1]  
precision, recall, thresholds = precision_recall_curve(y_test, probas)  
print len(precision)   
print len(thresholds)  

回报:

283  
282

因此,我不能将它们绘制在一起。关于为什么会出现这种情况的任何线索?

4

1 回答 1

11

对于这个问题,最后的精度和召回值应该被忽略。最后的精度和召回值总是分别为1和0,没有对应的阈值。

例如,这是一个解决方案:

def plot_precision_recall_vs_threshold(precisions, recall, thresholds): 
    fig = plt.figure(figsize= (8,5))
    plt.plot(thresholds, precisions[:-1], "b--", label="Precision")
    plt.plot(thresholds, recall[:-1], "g-", label="Recall")
    plt.legend()

plot_precision_recall_vs_threshold(precision, recall, thresholds)

这些值应该在那里,以便在您绘制精度与召回率时,绘图从 y 轴 (x=0) 开始。

于 2019-09-04T15:37:57.013 回答