-1

我开始使用 Nokogiri 并尝试从 IMDB 中提取一些数据。但是,IMDB 的 html 有点好笑,似乎找不到 css 选择器,例如创建者的名字:http ://www.imdb.com/title/tt1439629/ 。我怎么能得到我所追求的?

require 'nokogiri'
require 'open-uri'

url = "http://www.imdb.com/title/tt1439629/"
doc = Nokogiri::HTML(open(url))  
puts doc.at_css("h1").text.strip
4

2 回答 2

1

这是 Nokogiri 的初学者教程,它解释了如何通过 firebug 及其复制 CSS 功能非常容易地找到您正在寻找的内容。

http://ruby.bastardsbook.com/chapters/html-parsing/

于 2012-10-18T07:44:16.450 回答
0

这个有效:

puts doc.at_css("div.txt-block a").text.strip
> Dan Harmon
于 2012-10-18T06:04:52.747 回答