我已经用 Apache Nutch 抓取了一个网站并将其索引到 Solr。我网站的每个页面都有相同的标题,而且结果仅在内容字段中找到。那么我不能像这样提升字段:内容^ 0.5标题^ 2因为我的结果完全在内容字段中。在每个页面中都存在一个h2 html标签中的短语,如果短语(在h2 html标签中)我想提升一个文档) 包含搜索它的单词。我该怎么做?
问问题
158 次
我已经用 Apache Nutch 抓取了一个网站并将其索引到 Solr。我网站的每个页面都有相同的标题,而且结果仅在内容字段中找到。那么我不能像这样提升字段:内容^ 0.5标题^ 2因为我的结果完全在内容字段中。在每个页面中都存在一个h2 html标签中的短语,如果短语(在h2 html标签中)我想提升一个文档) 包含搜索它的单词。我该怎么做?