0

有些网站有 url模式www.___.com/id=1www.___.com/id=1000如何使用 nutch 抓取网站。有没有什么方法可以提供种子以在范围内获取?

4

2 回答 2

1

我认为最简单的方法是使用一个脚本来生成您的初始 URL 列表。

于 2010-06-14T13:39:37.253 回答
0

不。您已经手动或使用脚本注入它们

于 2014-03-18T17:54:32.897 回答