我在检索包含 JavaScript 的 HTML 代码时遇到问题。
我期望的是其中执行了 JavaScript 的 HTML 代码,并且其中只有纯 HTML,例如浏览器(例如 Chrome)的输出。
我的意思是我希望有一个 Linux 命令或一种下载 HTML、执行 JavaScript 并输出页面的方法。(curl 可以下载页面,但不能执行 JavaScript)
我在检索包含 JavaScript 的 HTML 代码时遇到问题。
我期望的是其中执行了 JavaScript 的 HTML 代码,并且其中只有纯 HTML,例如浏览器(例如 Chrome)的输出。
我的意思是我希望有一个 Linux 命令或一种下载 HTML、执行 JavaScript 并输出页面的方法。(curl 可以下载页面,但不能执行 JavaScript)
这是 Node.JS和Phantom.JS的一个很好的用例。这是一个完全涉及这个主题的演示文稿 - 从动态页面检索数据 - http://vimeo.com/66992296。
引自 Phantom.JS 网站:
PhantomJS 是一个可使用 JavaScript API 编写脚本的无头 WebKit。它具有对各种 Web 标准的快速和原生支持:DOM 处理、CSS 选择器、JSON、Canvas 和 SVG。
因此,它是一个可在您的服务器上运行的 Web 浏览器。你只需要从你的脚本中与它交谈。您可以使用例如Node.JS 的 phantomjs-node模块来执行此操作。