0

我们正在使用 Solr 1.4 为用户查询生成结果。结果是从包含大约 500k 个文档的索引中获取的。索引不断更新新文档,旧文档过期。

结果页面是按相关性(分数)排序的文档列表,由 solr 根据用户的查询自动计算。每个文档都属于一个类别(例如工程、金融、管理、数学等),类别 ID 由 Solr 存储和索引。

我们想要实现的是根据相关性对文档进行排序,但也要以某种方式加权,以便至少结果的第一页(10,20 或 50)包含来自尽可能多类别的文档和尽可能少的文档同一类别是连续的。

我们进行了很多搜索,但没有设法提出任何可行的方案。

非常感谢您的任何想法。GK

4

1 回答 1

1

据我所知,这在 Solr 中是不可能的。我的意思是,如果搜索词比其他任何东西更适用于工程项目,你需要根据搜索结果以不同的方式人为地提升其他类别。

您可以在最新版本中使用field collapsing执行类似的操作。即,您只会从一个类别中获得 X 次点击,然后是“显示更多类似这样”的链接。

或者,您可以进行多次搜索,每个类别一个,然后自己“混合”它们。

于 2011-12-13T13:41:27.383 回答