0

我需要评估一个纯基于内容的文档提取推荐系统(它也可以被视为搜索引擎),该系统根据相似度得分获得前 N 个结果。我知道有一些指标,例如 HR@k、accuracy@k、NDCG@k、CTR 等。但是,如果我理解正确,所有这些指标都需要专家编码员的预评估、文档评分(例如,规模从 1 到 5)或来自用户的点击模式。

这种基于内容的推荐系统还没有用户对查询结果进行评分/点击,我无法理解专家编码人员如何针对每个可能的查询为每个文档提供评分。

有没有办法评估这种基于内容的推荐系统?

4

0 回答 0