我正在尝试使用 Nokogiri从bit.ly 统计页面解析 Twitter 用户名:
require 'rubygems'
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://bitly.com/U026ue+/global'))
twitter_accounts = []
shares = doc.xpath('//*[@id="tweets"]/li')
shares.map do |tweet|
twitter_accounts << tweet.at_css('.conv.tweet.a')
end
puts twitter_accounts
我的理解是 Nokogiri 将以shares
某种形式的树结构保存,我可以用它来深入研究,但我的里程是不同的。