我在浏览网页寻找索引和搜索框架时偶然发现了 Solr。我们绝对需要的一个功能是根据包含命中的字段来提升结果。
一个小例子:
考虑这样的记录:
<movie>
<title>The Dark Knight</title>
<alternative_title>Batman Begins 2</alternative_title>
<year>2008</year>
<director>Christopher Nolan</director>
<plot>Batman, Gordon and Harvey Dent are forced to deal with the chaos unleashed by an anarchist mastermind known only as the Joker, as it drives each of them to their limits.</plot>
</movie>
例如,我想将title
,alternative_title
和plot
字段组合成一个搜索字段,这在查看 Solr/Lucene 文档和教程后并不难。
但是,我也希望获得成功的电影title
的得分高于热门电影,而那些电影的得分alternative_title
应该高于该plot
领域的热门电影。
有什么方法可以在 XML 中表示这种评分,还是我们需要开发一些自定义评分算法?
另请注意,我给出的示例是虚构的,真实数据可能包含 100 多个字段。