0

我是 nutch 和 solr 的新手。我使用 nutch 来抓取网站,并使用 solr 来索引这些页面。有没有一种方法可以检索 solr 数据库中链接的内容?

例如

谢谢

达尼洛

4

1 回答 1

0

页面的文本存储在名为“内容”的字段中。请注意,这不是原始页面,而是页面的解析版本。可搜索的内容应该出现在这里,而不是元标记和 javascript 之类的东西。

于 2013-10-17T19:11:25.673 回答