我们正在使用 Solr 1.4 为用户查询生成结果。结果是从包含大约 500k 个文档的索引中获取的。索引不断更新新文档,旧文档过期。
结果页面是按相关性(分数)排序的文档列表,由 solr 根据用户的查询自动计算。每个文档都属于一个类别(例如工程、金融、管理、数学等),类别 ID 由 Solr 存储和索引。
我们想要实现的是根据相关性对文档进行排序,但也要以某种方式加权,以便至少结果的第一页(10,20 或 50)包含来自尽可能多类别的文档和尽可能少的文档同一类别是连续的。
我们进行了很多搜索,但没有设法提出任何可行的方案。
非常感谢您的任何想法。GK