44

我已经在这个领域做了一些研究,但没有找到任何解决方案。我有一个站点,其中对 facebook 进行异步 ajax 调用(使用 JSONP)。我正在使用 VCR 在 Ruby 端记录我的所有 HTTP 请求,所以我认为将这个功能也用于 AJAX 调用会很酷。

所以我玩了一下,想出了一个代理尝试。我使用 PhantomJS 作为无头浏览器和 poltergeist 用于 Capybara 内部的集成。Poltergeist 现在配置为使用这样的代理:

  Capybara.register_driver :poltergeist_vcr do |app|
    options = {
      :phantomjs_options => [
        "--proxy=127.0.0.1:9100",
        "--proxy-type=http",
        "--ignore-ssl-errors=yes",
        "--web-security=no"
      ],
      :inspector => true
    }
    Capybara::Poltergeist::Driver.new(app, options)
  end
  Capybara.javascript_driver = :poltergeist_vcr

出于测试目的,我编写了一个基于 WEBrick 的代理服务器,它集成了 VCR:

require 'io/wait'
require 'webrick'
require 'webrick/httpproxy'

require 'rubygems'
require 'vcr'

module WEBrick
  class VCRProxyServer < HTTPProxyServer
    def service(*args)
      VCR.use_cassette('proxied') { super(*args) }
    end
  end
end

VCR.configure do |c|
  c.stub_with :webmock
  c.cassette_library_dir = '.'
  c.default_cassette_options = { :record => :new_episodes }
  c.ignore_localhost = true
end

IP   = '127.0.0.1'
PORT = 9100

reader, writer = IO.pipe

@pid = fork do
  reader.close
  $stderr = writer
  server = WEBrick::VCRProxyServer.new(:BindAddress => IP, :Port => PORT)
  trap('INT') { server.shutdown }
  server.start
end

raise 'VCR Proxy did not start in 10 seconds' unless reader.wait(10)

这适用于每个 localhost 调用,并且它们得到了很好的记录。HTML、JS 和 CSS 文件由 VCR 录制。然后我启用了该c.ignore_localhost = true选项,因为(在我看来)记录本地主机调用没有用。

然后我再次尝试,但我必须弄清楚,在页面上进行的 AJAX 调用没有被记录。更糟糕的是,它们不再在测试中工作。

所以说到重点,我的问题是:为什么所有对本地主机上的 JS 文件的调用都被记录了,而 JSONP 对外部资源的调用却没有?它不可能是 jsonP 的东西,因为它是一个“正常”的 ajax 请求。或者 phantomjs 内部是否存在错误,即 AJAX 调用没有被代理?如果是这样,我们该如何解决?

如果它正在运行,我想在里面集成启动和停止程序

- - - - 更新 - - - -

我做了一些研究,得出了以下几点:代理在HTTPS调用和通过HTTPS调用的二进制数据方面存在一些问题。

我启动了服务器,并进行了一些 curl 调用:

curl --proxy 127.0.0.1:9100 http://d3jgo56a5b0my0.cloudfront.net/images/v7/application/stories_view/icons/bug.png

该呼叫将按应有的方式记录下来。代理的请求和响应输出是

GET http://d3jgo56a5b0my0.cloudfront.net/images/v7/application/stories_view/icons/bug.png HTTP/1.1
User-Agent: curl/7.24.0 (x86_64-apple-darwin12.0) libcurl/7.24.0 OpenSSL/0.9.8r zlib/1.2.5
Host: d3jgo56a5b0my0.cloudfront.net
Accept: */*
Proxy-Connection: Keep-Alive

HTTP/1.1 200 OK 
Server: WEBrick/1.3.1 (Ruby/1.9.3/2012-10-12)
Date: Tue, 20 Nov 2012 10:13:10 GMT
Content-Length: 0
Connection: Keep-Alive

但是这个调用没有被记录,肯定是 HTTPS 有问题:

curl --proxy 127.0.0.1:9100 https://d3jgo56a5b0my0.cloudfront.net/images/v7/application/stories_view/icons/bug.png

头文件输出为:

CONNECT d3jgo56a5b0my0.cloudfront.net:443 HTTP/1.1
Host: d3jgo56a5b0my0.cloudfront.net:443
User-Agent: curl/7.24.0 (x86_64-apple-darwin12.0) libcurl/7.24.0 OpenSSL/0.9.8r zlib/1.2.5
Proxy-Connection: Keep-Alive

HTTP/1.1 200 OK 
Server: WEBrick/1.3.1 (Ruby/1.9.3/2012-10-12)
Date: Tue, 20 Nov 2012 10:15:48 GMT
Content-Length: 0
Connection: close

所以,我想也许代理不能处理 HTTPS,但它可以(只要我在 cURL 调用后得到控制台上的输出)。然后我想,也许 VCR 不能模拟 HTTPS 请求。但是使用这个脚本,当我不在代理中使用它时,VCR 会模拟 HTTPS 请求:

require 'vcr'

VCR.configure do |c|
  c.hook_into :webmock
  c.cassette_library_dir = 'cassettes'
end

uri = URI("https://d3jgo56a5b0my0.cloudfront.net/images/v7/application/stories_view/icons/bug.png")

VCR.use_cassette('https', :record => :new_episodes) do
  http = Net::HTTP.new(uri.host, uri.port)
  http.use_ssl = true
  http.verify_mode = OpenSSL::SSL::VERIFY_NONE
  response = http.request_get(uri.path)
  puts response.body
end

那么问题是什么?VCR 处理 HTTPS,代理处理 HTTPS。为什么他们不一起玩?

4

2 回答 2

7

所以我做了一些研究,现在我有了一个工作 VCR 代理服务器的非常基本的示例,它作为 MITM 代理服务器处理 HTTPS 调用(如果您在客户端中停用安全检查)。如果有人可以贡献并帮助我将这件事变为现实,我将非常高兴。

这是 github 仓库:https ://github.com/23tux/vcr_proxy

于 2013-03-19T19:42:36.200 回答
1

Puffing Billy是一个非常好的工具。您需要指定要绕过的域,以及需要存根的 url。存根 https url 也有点棘手。您需要将 https url 存根为https://www.example.com:443/path/

于 2018-04-13T01:06:33.183 回答