假设我们有一个包含人名和别名数组的文档,如下所示:
{
name: "Christian",
aliases: ["נוצרי", "کریستیان" ]
}
假设我有一个包含 10 个别名的文档和另一个包含 2 个别名的文档,但它们都包含带有 value 的别名کریستیان
。
第length of field (dl)
一个文档的 比第二个文档大,因此第term frequency (tf)
一个文档的 比第二个文档低。最终,具有较少别名的文档的分数比另一个大。
有时我想为不同语言和不同形式的人添加更多别名,因为他/她更有名,但这会导致结果得分较低。我想以某种方式length of the aliases field
退出我的查询计算。