我使用Nokogiri
如下:
require 'nokogiri'
require 'open-uri'
# Get a Nokogiri::HTML::Document for the page we’re interested in...
doc = Nokogiri::HTML(open('http://www.google.com/search?q=sparklemotion'))
但我的不好,由于公司防火墙可能是,我收到错误:
C:/Ruby193/lib/ruby/1.9.1/net/http.rb:762:in `initialize': getaddrinfo: No such
host is known. (SocketError)
因此,我认为我将使用selenium-webdriver
导航和nokogiri
处理网页源html
。
require "rubygems"
require "selenium-webdriver"
driver = Selenium::WebDriver.for :firefox
driver.get "http://www.google.com/search?q=sparklemotion"
那么在这里我将如何将网页内容(html)提供给nokogiri
?
请在这里给我建议。