0

有没有什么办法可以修改Lucene默认的相似度评分功能以支持多值字段搜索,即对于具有三个“persons”字段的文档,每个名称会有三个不同的相似度评分。

例如,将一篇论文作为一个文档进行索引,其作者有多个别名,

第一人:大卫·鲍伊、大卫·罗伯特·琼斯、Ziggy Stardust、瘦白公爵

第二人:大卫莱特曼

第三人:大卫·哈塞尔霍夫、大卫·迈克尔·哈塞尔霍夫

当我们搜索“David”时,是否可以返回 3 个不同的相似度得分,其中 Score(Person 2) > Score(Person 3) > Score(Person 1)。

此外,我们能否实现 Indri 风格的 MAX 或 AVG 运算符,其中 MAX(document)=Score(Person 2) 和 AVG(document)=AVG{Score(Person 2), Score(Person 3), Score(Person 1)}

任何指向可以修改 Lucene 实现部分的指针都将受到赞赏。谢谢。

4

0 回答 0