0

我正在使用 Nutch 和 Lucene (java API) 进行网站关键字搜索。我的问题是 Nutch 无法分配包含所需关键字的所有页面。例如。我有一个名为“Luxury Bag”的产品,如果我用“Luxury”搜索,我不会在结果中找到该产品,如果我用“Luxury Bag”找到它。我为这个错误花了一个多星期的时间,完全不知道。另外,我用 Luke Program 测试了我的爬取数据。它与 Luke 完美搭配,但不适用于我的 java 代码。任何人都可以建议我。欢迎和赞赏任何建议。谢谢。

4

1 回答 1

0

我刚刚解决了这个问题。

Query query = Query.parse(searchQuery, conf);
QueryParams queryParams = new QueryParams();
queryParams.setMaxHitsPerDup(100);
queryParams.setNumHits(100);
query.setParams(queryParams);
Hits hits = bean.search(query);
long allResultsCount =**hits.getTotal());**

我把它改成了

long allResultsCount =**hits.getLength());**
于 2013-06-25T03:00:47.503 回答