我正在使用 Nokogiri 来抓取网页。很少有 url 需要被猜测并在它们不存在时返回 404 not found 错误。有没有办法捕获这个异常?
http://yoursite/page/38475 #=> page number 38475 doesn't exist
我尝试了以下不起作用。
url = "http://yoursite/page/38475"
doc = Nokogiri::HTML(open(url)) do
begin
rescue Exception => e
puts "Try again later"
end
end