我正在学习精确和回忆文件,但我无法理解这个特定问题。
下表显示了由 A 和 B 表示的两个排名检索搜索引擎返回的前 6 个结果的相关性。“+”表示相关文档,“-”表示非相关文档。
假设集合中相关文档的总数为 4,计算前 1、2、3、4、5 和 6 个结果的两个引擎的精确召回值。
为搜索引擎 A 给出的解决方案是:
精度:--100%--|--50%--|--33.3%--|--25%--|--40%--|--50%--|
召回:------25%--|--25%--|--25%-----|--25%--|--50%--|--75%-- |
B的解决方案:
精度:--|100%--|--100%--|--66.6%--|--50%--|--60%--|--50%--|
召回:----|---25%---|--50%----|--50%-----|--50%--|--75%--|- -75%--|
我知道如何计算单个文档,Precsion = TP/(TP+FP) 和 Recall 是 TP/(TP+FN)。我只是不确定上面的一些值是如何计算的。