分类器的召回是什么意思,例如贝叶斯分类器?请举个例子。
例如,精度 = 正确/正确+错误的测试数据文档。如何理解召回?
分类器的召回是什么意思,例如贝叶斯分类器?请举个例子。
例如,精度 = 正确/正确+错误的测试数据文档。如何理解召回?
召回字面意思是召回(找到)了多少真阳性,即还找到了多少正确命中。
精度(您的公式不正确)是返回的命中有多少是真阳性,即找到的命中有多少是正确的。
我发现 Wikipedia 中对Precision and Recall的解释非常有用:
假设一个用于识别照片中狗的计算机程序在包含 12 只狗和一些猫的图片中识别出 8 只狗。在识别出的 8 只狗中,有 5 只实际上是狗(真阳性),其余的是猫(假阳性)。该程序的精度为 5/8,而其召回率为 5/12。当搜索引擎返回 30 个页面,其中只有 20 个是相关的,而没有返回 40 个额外的相关页面时,其精确度为 20/30 = 2/3,而其召回率为 20/60 = 1/3。
因此,在这种情况下,精度是“搜索结果的有用程度”,而召回率是“结果的完整程度”。
ML 中的精度与信息检索中的精度相同。
recall = TP / (TP + FN)
precision = TP / (TP + FP)
(其中 TP = 真阳性,TN = 真阴性,FP = 假阳性,FN = 假阴性)。
将这些符号用于二元分类器是有意义的,通常“肯定”是不太常见的分类。请注意,精度/召回指标实际上是特定形式,其中 #classes=2 表示更一般的混淆矩阵。
此外,您的“精度”符号实际上是accuracy,并且是(TP+TN)/ ALL
用非常简单的语言:例如,在一系列展示政治家的照片中,有多少次政治家 XY 的照片被正确识别为展示的是 A. Merkel 而不是其他政治家?
精度是识别另一个人的次数(误报)的比率:(正确命中)/(正确命中)+(误报)
召回率是照片中显示的人的姓名被错误识别(“召回”)的比率:(正确呼叫)/(正确呼叫)+(错误呼叫)
给你一个例子。想象一下,我们有一个机器学习模型可以检测猫与狗。由人类提供的实际标签称为ground-truth。模型的输出再次称为预测。现在看下表:
ExampleNo Ground-truth Model's Prediction
0 Cat Cat
1 Cat Dog
2 Cat Cat
3 Dog Cat
4 Dog Dog
假设我们要查找类 cat 的召回率。根据定义,召回是指正确识别的某个类别的百分比(来自该类别的所有给定示例)。因此对于 cat 类,模型正确识别了它 2 次(例如 0 和 2)。但这是否意味着实际上只有 2 只猫?不!实际上,ground truth 中有 3 只猫(人类标记)。那么这个类的正确识别率是多少呢?2 out of 3 that is (2/3) * 100 = 66.67%
或者0.667
如果你在 1 内对其进行归一化。这是示例 3 中对 cat 的另一个预测,但它不是正确的预测,因此我们不考虑它。
现在来到数学公式。首先了解两个术语:
TP(真阳性):当它实际上是积极的时候预测一些积极的事情。如果猫是我们的正面例子,那么当它实际上是一只猫时,预测它是一只猫。
FN(假阴性):当它实际上不是消极的时候预测消极的东西。
现在对于某个类,这个分类器的输出可以是两种类型:猫或狗(非猫)。所以正确识别的数量就是真阳性(TP)的数量。同样,该类别的真实样本总数将是 TP + FN。因为在所有猫中,模型要么正确地检测到它们(TP),要么没有正确地检测到它们(FN,即模型错误地说是阴性(非猫),而实际上是阳性(猫))。所以对于某个类 TP + FN 表示该类的基本事实中可用的示例总数。所以公式是:
Recall = TP / (TP + FN)
同样,也可以为 Dog 计算召回率。当时认为狗是正类,猫是负类。
因此,对于任意数量的类,要找到某个类的召回率,就以该类为正类,其余类为负类,并使用公式求召回。继续每个类的过程以找到所有类的召回率。
如果您也想了解精度,请访问此处:https ://stackoverflow.com/a/63121274/6907424