0

在诸如谷歌浏览器之类的浏览器中,当我想获取页面信息时,我只选择查看页面源,但在某些使用javascript的网站中你不能这样做,所以我发现在按钮等任何元素上并选择检查element 它会向我显示我需要的信息,它真的很棒,但我想自动执行此操作,例如对于使用 html 的简单页面,我只是使用 wget 将页面保存为文本以便稍后分析它,但对于那些使用 javascript 和 css 是不可能的,所以我的问题是有一种工具或任何方法来获取我需要的信息并将其保存为文本假设我指定了站点和元素(按钮),它将下载代码并保存它到文本

4

1 回答 1

1

如果你使用 chrome,你可以Ctrl + Shift + J打开开发者工具窗口。单击最左上角的图标(元素)以查看 JavaScript 修改后的 DOM。

在 IE(我认为是 7 或更高版本)中使用F12打开类似的窗口。

而在 FireFox 中你可以用它Ctrl + Shift +I来打开一个类似的窗口。

为了使这个过程自动化,请尝试使用http://www.phantomjs.org/如此处建议:wget + JavaScript?

编辑:

IE 中有一个保存按钮,用于保存当前的 DOM:

在此处输入图像描述

Ctrl + Shift + I按下后在 FireFox 中Ctrl + S,它将保存当前的 DOM。

编辑2:

下载 PhantomJS,创建一个名为script.jspaste 的文件:

system = require('system');
var page = new WebPage();
page.open(system.args[1], function (status) {
    if(status == 'success') {
        html = page.evaluate(function() {
            return document.getElementsByTagName('html')[0].innerHTML;
        }); 
        console.log(html);
    } else {
        console.log('Page could not be loaded');
    }
    phantom.exit();
});

在注释行运行phantomjs script.js http://www.website.co.uk > website.html(script.js 和 phantom.exe 必须在当前工作目录中)。更改http://www.website.co.uk为您需要下载的网站以及website.html您要保存到的`html 文件。

于 2012-07-05T09:50:51.390 回答