现在很多网站都包含一些通过ajax加载的内容(例如,一些视频网站中的评论)。通常我们无法爬取这些数据,得到的只是一些js源代码。那么问题来了:在获得 html 响应并到达我们想要的最终页面后,我们可以通过哪些方式执行 javascript 代码?
我知道 HtmlUnit 具有执行后台 js 的能力,但是存在一些错误和错误。还有其他工具可以帮助我吗?
有人告诉我,我可以爬取ajax请求的url,分析它的参数,然后再次发送请求,从而获取数据。如果事情不能按照我上面提到的方式解决,谁能告诉我如何提取 ajax url 并以正确的格式发送请求?
顺便说一句,如果语言是java,那将是最好的