1

我在网站中读到 nutch 从每个链接获取链接等于 topN。我有 4 个链接,但是当 nutch 抓取我的链接时,所有使用 nutch 返回的结果都等于 topN。这意味着如果我有 4 个链接并且 topN = 10,nutch 从所有链接中获取 10 个链接,而不是每个链接。爬行结束时我有 10 个链接。帮我。

4

1 回答 1

2

从另一个角度来看,topN表示从每个深度级别获得多少文档。 深度意味着要执行多少生成/获取/更新周期才能获得完整的页面覆盖率。

于 2012-01-16T08:31:19.273 回答