0

有谁知道我可以在其中输入域名的任何程序,该程序将爬取整个域并能够为我下载所有 HTML 源代码 - 所以如果该站点在页面上有链接,它只会爬取到域名上的页面,显然不是外部域名。

4

1 回答 1

1

看看python的scrapy:

http://www.scrapy.org

或 java 的 crawler4j:

http://code.google.com/p/crawler4j/

于 2012-10-10T23:53:34.293 回答