在卷曲网站之前如何等到所有 Javascript 加载完毕?我正在尝试从我的一个页面下载 HTML,但它异步获取信息,因此 cURL 获取半加载页面。有没有办法让 cURL 获取一个完全加载的页面?
问问题
3967 次
1 回答
6
您需要使用无头浏览器引擎来执行此操作。cURL 和 wget 是 HTTP 库;他们说 HTTP 并以文本形式下载文档。他们没有 DOM 或 JavaScript 引擎的概念来帮助他们理解页面正在执行 AJAX。所以要下载 HTML,你需要一个更像浏览器的东西,通过解析 DOM 和执行 JS。我推荐使用 Mozilla 引擎的Crowbar 。
于 2012-07-03T17:06:09.210 回答