我正在使用 nutch 1.6 抓取包含 20 个产品/页面的分页网页,使用以下命令:
./nutch crawl urls -dir <dir> -depth 4 -topN 100 -threads 100
我收到了 20 款首批产品和以下页面的链接。但是爬虫没有关注我的下一页链接?我错过了一个参数吗?
我正在使用 nutch 1.6 抓取包含 20 个产品/页面的分页网页,使用以下命令:
./nutch crawl urls -dir <dir> -depth 4 -topN 100 -threads 100
我收到了 20 款首批产品和以下页面的链接。但是爬虫没有关注我的下一页链接?我错过了一个参数吗?