我正在尝试创建一个功能,该功能将从维基百科页面中抓取演员的电影作品。这是代码示例
doca = Nokogiri::HTML(open("http://en.wikipedia.org/wiki/Kevin_Bacon"))
grandparent = doca.xpath('//div[@id="mw-content-text"]').children()
child = []
grandparent.each {|node|
node.children.each{|x|
if x['id'] == "Films"
child = node.next_element.children
break
end
}
}
子数组的每个元素现在都包含一排电影表。我真正想要的是将每部电影的href链接保存到一个数组中,但是由于它们嵌套在每个数组中,因此无法访问它们。非常感谢任何帮助