我试图破译发现结果中的passage_score 和result[].score 的含义(以百分位数表示)。这样我们就可以过滤掉不满足最小置信度阈值的段落和结果。
例如在这个结果集中:
{
...
"passages": [
{
"document_id": "AA",
"passage_score": 14.303232050575723,
...
},
{
"document_id": "BB",
"passage_score": 14.089714658115533,
...
}
],
"results": [
{
"id": "AA",
"score": 1.5188946,
...
},
{
"id": "BB",
"score": 1.5188946,
...
}
]
}
我如何将分数转换为百分位数进行比较?在 RnR 中,我曾经使用 ranker.confidence 字段来执行此操作。