0

我想解析phantomjs的英文版html源代码。

以下是我的代码:

var page = require('webpage').create();

if (phantom.args.length === 0) {
    console.log('Usage: google.js keyword');
    phantom.exit();
}

address = "http://www.google.com"
keyword = phantom.args[0];

page.open(address, function (status) {
    if (status !== 'success') {
        console.log('FAIL to load the address');
    } else {

        if (page.injectJs("jquery-1.3.2.min.js")) {
            console.log("jQuery loaded...");
        }   

        console.log(page.content);
    }

    phantom.exit();
});

但是,由于我在台湾,所以我得到的是中文版。我的平台是 Macbook Pro,Mountain Lion(英文版)。

如何更改我解析的语言?谢谢你。

4

1 回答 1

1

您获得页面的语言取决于站点的实现。如果站点根据您的位置决定语言,则对您来说情况更糟。解决此问题的唯一方法是使用来自英语地区的代理服务器。

更新

如果是 google.com,请使用以下网址

https://www.google.com/?hl=en 

代替

https://www.google.com/
于 2012-08-09T07:01:07.843 回答