Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想设置爬虫来爬取网站,比如说博客,然后只获取网站中的链接并将链接粘贴到文本文件中。你能指导我一步一步设置爬虫吗?我正在使用 Eclipse。
Jsoup将做所有你需要的 html 解析。Jsoup 是一个用于处理 html 源代码的 java api。你可以得到
和更多。
出于您的目的,这里是示例代码。
希望这会帮助你。