0

我已经用 Apache Nutch 抓取了一个网站并将其索引到 Solr。我网站的每个页面都有相同的标题,而且结果仅在内容字段中找到。那么我不能像这样提升字段:内容^ 0.5标题^ 2因为我的结果完全在内容字段中。在每个页面中都存在一个h2 html标签中的短语,如果短语(在h2 html标签中)我想提升一个文档) 包含搜索它的单词。我该怎么做?

4

1 回答 1

0

您可以使用Edismax (extended Dismax ) Parser 根据匹配提升结果。
它允许基于个人术语匹配(qf 和 qs)、短语匹配与短语 slop(ps 和 ps)和 shingle 匹配(pf2 和 pf2)来增强匹配。
您可以配置请求处理程序以相应地提高匹配的相关性。

于 2012-08-15T06:45:15.503 回答