6

我正在使用 scikits 接口训练具有交叉验证(stratifiedKfold)的 svm 分类器。对于每个(k 个)测试集,我得到一个分类结果。我想要一个包含所有结果的混淆矩阵。Scikits 有一个混淆矩阵接口:sklearn.metrics.confusion_matrix(y_true, y_pred) 我的问题是我应该如何累积 y_true 和 y_pred 值。它们是数组(numpy)。我应该根据我的 k-fold 参数定义数组的大小吗?对于每个结果,我应该将 y_true 和 y-pred 添加到数组中????

4

1 回答 1

2

您可以使用聚合混淆矩阵,也可以为每个 CV 分区计算一个,然后计算矩阵中每个分量的均值和标准差(或标准误差),作为可变性的度量。

对于分类报告,需要修改代码以接受二维输入,以便传递每个 CV 分区的预测,然后计算每个类的平均分数和标准偏差。

于 2012-03-18T18:10:32.917 回答