上图显示了文档检索设置中精度和召回率的标准示例。
要计算排名 1 的平均精度,您只需执行以下操作:
(1.0 + 0.67 + 0.75 + 0.8 + 0.83 + 0.6) / 6 = 0.78
上面的示例非常适合小型文档集合,但假设您有一个包含 100,000 个文档的搜索引擎,而一个查询可能包含 100 个相关文档。如果将 K 的长度保持在 10,将如何调整上述内容?
一个例子:
已确定 Ranking #1 的查询有 20 个相关文档,以上是否变为:
(1.0 + 0.67 + 0.75 + 0.8 + 0.83 + 0.6) / 20 = 0.23
还是您仍然除以 6,因为那是长度为 K 的等级内的相关文档的数量?