17

据此,现在可以修改标题。Atm 我需要在 PhantomJS webdriver 中修改 Accept-Language。此代码不起作用

DesiredCapabilities.PHANTOMJS['phantomjs.page.customHeaders.Accept-Language'] = 'ru-RU'
driver = webdriver.PhantomJS()

是否有可能以某种方式配置 Phantomjs 以发送我的标头?我不在乎在哪里:在 ghostdriver、phantomjs 或 phantomjs-webdriver 中。

4

2 回答 2

32

PhantomJS的最新版本 ( 1.9.1 ) 是 2013 年 6 月 5 日发布的。拉取请求已合并Jun/23/2013

如果您使用的是 1.9.1 版本的 PhantomJS,自定义标头将不起作用。

您必须自己构建 phantomjs 或等到 phantomjs 合并 ghostdriver 更改并发布新版本。

  • 克隆 PhantomJS 存储库
  • 克隆 ghostdriver 存储库
  • 以递归方式将 ghostdriver/src/* 复制到 phantomjs/src/ghostdriver
  • 构建 phantomjs

使用新构建的 phantomjs 我得到以下结果:

from selenium import webdriver

webdriver.DesiredCapabilities.PHANTOMJS['phantomjs.page.customHeaders.Accept-Language'] = 'ru-RU'
driver = webdriver.PhantomJS()
driver.get('http://httpbin.org/headers')
print(driver.page_source)

...
{
  "headers": {
    "Connection": "close",
    "Host": "httpbin.org",
    "Accept-Encoding": "gzip",
    "Accept-Language": "ru-RU",
    "User-Agent": "Mozilla/5.0 (Unknown; Linux i686) AppleWebKit/534.34 (KHTML, like Gecko) PhantomJS/1.10.0 (development) Safari/534.34",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"
  }
 ...

更新

使用 PhantomJS 1.9.2+

于 2013-07-25T15:32:47.090 回答
2

我写了一个完整的例子来设置 selenium phantomjs 中的所有标题、窗口大小和代理:

from selenium import webdriver

def init_phantomjs_driver(*args, **kwargs):

    headers = { 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
        'Accept-Language':'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.2; WOW64; rv:47.0) Gecko/20100101 Firefox/47.0',
        'Connection': 'keep-alive'
    }

    for key, value in headers.iteritems():
        webdriver.DesiredCapabilities.PHANTOMJS['phantomjs.page.customHeaders.{}'.format(key)] = value

    webdriver.DesiredCapabilities.PHANTOMJS['phantomjs.page.settings.userAgent'] = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36'

    driver =  webdriver.PhantomJS(*args, **kwargs)
    driver.set_window_size(1400,1000)

    return driver


def main():
    service_args = [
        '--proxy=127.0.0.1:9999',
        '--proxy-type=http',
        '--ignore-ssl-errors=true'
        ]

    driver = init_phantomjs_driver(service_args=service_args)

    driver.get('http://cn.bing.com')

笔记:

userAgent设置在phantomjs.page.settings.userAgent而不是phantomjs.page.customHeaders

于 2016-10-14T07:41:06.343 回答