我想编写一个支持cookies存储操作和会话的爬虫。java无头浏览器有两种不同的实现。HtmlUnit 对 javascript 和 html 解析有更好的支持。但是有任何理由使用 HttpUnit 来提高爬虫的性能吗?
问问题
1368 次
这里有一篇相关文章,来自 HtmlUnit 开发人员之一。
它基本上说,除了 Javascript 支持之外,HtmlUnit 比 HttpUnit 更高级。HtmlUnit 似乎也得到了更积极的开发(2014 年发布了 2 个版本,而 HttpUnit 自 2008 年以来没有更新)。