1

我用 Apache Nutch 抓取了一个网站并将其索引到 Apache Solr。我如何提升以特定字体(如 h2 html 标签或...)存在的查询词的文档?例如我的查询是书,有两页包含书。第一页书在 h1 html 标记中,第二页书在 h2 html 标记中。我希望第二页出现在较高的结果中(有更大的提升)。谢谢

4

1 回答 1

0

我认为 PayLoads(https://issues.apache.org/jira/browse/LUCENE-755)对您的情况会有所帮助(对某个词的某些出现进行评分高于其他词)。

查看http://edwarddrapkin.com/2011/04/14/an-introduction-to-lucene-payloads/了解详细说明。

于 2012-08-15T08:27:08.783 回答