我已经用 Java Nutch 爬了几页我还用 Java 中的 Lucene 制作了一个模块,它允许对索引文档执行查询。我知道我创建了像 url、重量和标题这样的 Nutch 字段。但我对捕捉每一页的内容很感兴趣。我如何使用 Lucene 并知道我已经用 nutch 爬行了?
谢谢
我已经用 Java Nutch 爬了几页我还用 Java 中的 Lucene 制作了一个模块,它允许对索引文档执行查询。我知道我创建了像 url、重量和标题这样的 Nutch 字段。但我对捕捉每一页的内容很感兴趣。我如何使用 Lucene 并知道我已经用 nutch 爬行了?
谢谢