0

我正在学习精确和回忆文件,但我无法理解这个特定问题。

下表显示了由 A 和 B 表示的两个排名检索搜索引擎返回的前 6 个结果的相关性。“+”表示相关文档,“-”表示非相关文档。

在此处输入图像描述

假设集合中相关文档的总数为 4,计算前 1、2、3、4、5 和 6 个结果的两个引擎的精确召回值。

为搜索引擎 A 给出的解决方案是:

精度:--100%--|--50%--|--33.3%--|--25%--|--40%--|--50%--|
召回:------25%--|--25%--|--25%-----|--25%--|--50%--|--75%-- |

B的解决方案:

精度:--|100%--|--100%--|--66.6%--|--50%--|--60%--|--50%--|
召回:----|---25%---|--50%----|--50%-----|--50%--|--75%--|- -75%--|

我知道如何计算单个文档,Precsion = TP/(TP+FP) 和 Recall 是 TP/(TP+FN)。我只是不确定上面的一些值是如何计算的。

4

1 回答 1

1

与其试图记住公式,不如试着理解这些概念。

“精度”是:结果正确的比例是多少?因此,对于 A 和 B,如果您取最高的结果,则它是正确的。精度为 100%。

“召回”是:出现正确结果的比例是多少?因此,对于 A 和 B,如果您取最高的结果,则您有四分之一的正确值,因此召回率为 25%。

于 2015-05-09T16:57:40.913 回答