2

我实际上想知道,我们如何验证或评估 BM25 公式中 b 和 k1 的值?换句话说,最“科学”的评估方法是什么?

是否有任何研究论文可供我们参考,以了解此类评估是如何进行的?

4

1 回答 1

3

这些 BM25 参数的最佳值在很大程度上取决于您的数据收集。阅读本文:可插入的相似性算法 | 弹性搜索

调整参数的一种简单方法是调整它们,然后评估它们的性能影响。如果结果不令人满意,请再次更改参数并评估结果。它可以通过遗传或 ACO 等元启发式算法实现自动化。

一些论文也可用:

于 2016-06-30T07:50:46.143 回答