我正在尝试使用 PhantomJS 加载页面(使用 Javascript 在网页上加载项目)并将页面上的所有 HTML(至少在<body />
标签内)返回给执行的 PHP 函数phantomjs httpget.js
。
问题:我可以让 phantomjs 返回document.title
,但要求它console.log(document.body)
简单会给我一个[object Object]
. 如何提取页面的 HTML?
与浏览器相比,使用 phantomjs 加载网页也需要更长的时间。
httpget.js
console.log('hello!');
var page = require('webpage').create();
page.open("http://www.asos.com/Men/T-Shirts-Vests/Cat/pgecategory.aspx?cid=7616#parentID=-1&pge=0&pgeSize=900&sort=1",
function(status){
console.log('Page title is ' + page.evaluate(function () {
return document.body;
}));
phantom.exit();
});
输出 (从外壳运行)
hello!
Page title is [object Object]