0

当我向网站添加新页面时, Nutch会自动抓取吗?

4

3 回答 3

1

不,您必须从头开始重新抓取或创建索引。

于 2010-05-11T10:30:37.747 回答
1

Tt 不会自动重新抓取。您可以执行以下任一操作:

  1. 使新url的父页面重新爬取,使新url进入crawlerdb,并在后续的fetch轮中被获取。
  2. 通过注入命令将新的 url 直接添加到 crawldb。
于 2012-04-08T03:52:21.083 回答
0

您应该执行计划的爬网以使您的数据保持最新。

开源 Java 作业调度程序

于 2012-04-20T10:54:39.437 回答