我正在使用 Nokogiri 打开有关各个国家的维基百科页面,然后从跨维基链接(外语维基百科的链接)中提取这些国家的其他语言名称。但是,当我尝试打开France 的页面时,Nokogiri 没有下载完整页面。也许它太大了,反正它不包含我需要的跨维基链接。我怎样才能强制它全部下载?
这是我的代码:
url = "http://en.wikipedia.org/wiki/" + country_name
page = nil
begin
page = Nokogiri::HTML(open(url))
rescue OpenURI::HTTPError=>e
puts "No article found for " + country_name
end
language_part = page.css('div#p-lang')
测试:
with country_name = "France"
=> []
with country_name = "Thailand"
=> really long array that I don't want to quote here,
but containing all the right data
也许这个问题超出了 Nokogiri 并进入了 OpenURI——无论如何我需要找到一个解决方案。