1

我有一个数据框如下: 在此处输入图像描述

  1. 第 0 列 (0,1,2,3...) 指的是 document_ids
  2. 40041,37962,37985... 是表示与文档相关的对象的 id。例如,document_id 2 具有相关(真实)对象 37985 和预测对象 37985,37983。
  3. 真相——实物(黄金标准)
  4. 预测的——我的算法预测的对象
  5. 重叠 – 对象同时存在于真值和预测列表中
  6. 未检测到 - 对象存在于真值列表中,但算法未检测到。

我的问题:

  • 给定以下数据集,我可以使用哪些评估措施?因为我还没有误报,所以不可能精确。准确性或杰卡德相似度如何?Scikit在这里列出了几个评估措施。我正在寻找评估未排名列表的措施..
4

0 回答 0