我的深度学习主题是将图像分为 5 个不同的类别。我使用 ImageDataGenerator 库将我的数据集拆分为训练和测试。我已经成功开发了一个遵循 CNN 方法的模型架构,并在测试数据集上评估了我的模型的性能,这给了我 83% 的准确率。
是否可以应用精度、召回率、f1_score 等 sklearn 评估指标来评估我的测试结果?如果是,我该怎么做?
我的深度学习主题是将图像分为 5 个不同的类别。我使用 ImageDataGenerator 库将我的数据集拆分为训练和测试。我已经成功开发了一个遵循 CNN 方法的模型架构,并在测试数据集上评估了我的模型的性能,这给了我 83% 的准确率。
是否可以应用精度、召回率、f1_score 等 sklearn 评估指标来评估我的测试结果?如果是,我该怎么做?
是的,只要您的模型在预测时给出类标签或概率,您就可以这样做。
如果您的模型正在预测编码(整数)标签,那么您可以使用
sklearn.metrics.precision_score(y_true, model.predict(test_x))
另一方面,如果模型正在预测通常情况下的概率,那么您必须首先使用 将它们转换为类标签argmax
。因此,如果您有一批test_x
数据,那么您可以使用
sklearn.metrics.precision_score(y_true, np.argmax(model.predict(test_x), axis=1))