0

一些网站似乎完全依赖 javascript 来生成他们的网页。作为用户,我们甚至看不到最终的“真实”HTML 输出。例如,如果您打开一个fedex跟踪页面< https://www.fedex.com/fedextrack/?tracknumbers=YOUR_TRACKING_NUMBER >,并查看其源页面(<view-source: https://www.fedex.com/ fedextrack/?tracknumbers=YOUR_TRACKING_NUMBER > 在 chrome 中),您只能看到一些 javascript 代码。

问题:我们如何分析这样的网页?例如,我们如何开发程序来自动重构和理解输出的 HTML?

4

1 回答 1

2

您可以使用无头 Web 浏览器重建 DOM。这是一个示例:Phantom JS

或者,您可以使用Selenium为实际的 Web 浏览器编写脚本。

于 2013-10-21T13:59:07.237 回答