我是java新手。我想做一个简单的网络爬虫。如何访问java中网站的robots.txt文件。实际上我对robots.txt不太了解。请帮帮我。
问问题
2574 次
1 回答
1
你需要解决两个任务:
- 使用 HTTP 库通过 HTTP 获取文件——如何在 Java 中发送 HTTP 请求?
- 为 robots.txt 文件编写或使用解析器——robots.txt parser java
于 2012-04-10T23:52:21.273 回答