- 第 0 列 (0,1,2,3...) 指的是 document_ids
- 40041,37962,37985... 是表示与文档相关的对象的 id。例如,document_id 2 具有相关(真实)对象 37985 和预测对象 37985,37983。
- 真相——实物(黄金标准)
- 预测的——我的算法预测的对象
- 重叠 – 对象同时存在于真值和预测列表中
- 未检测到 - 对象存在于真值列表中,但算法未检测到。
我的问题:
- 给定以下数据集,我可以使用哪些评估措施?因为我还没有误报,所以不可能精确。准确性或杰卡德相似度如何?Scikit在这里列出了几个评估措施。我正在寻找评估未排名列表的措施..
