13

我编写了处理 url 获取的简单函数:

def tender_page_get url, agent
  sleep(rand(6)+2)
  begin
    return agent.get(url).parser
  rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound
    EYE.debug "--winter sleep #{url}"
    puts "-x-#{url}"
    sleep(300)
    tender_page_get url, agent
  rescue => e
    puts "-x-#{url}"
    EYE.debug "--unknown exception"
    EYE.debug "#{url} #{e.inspect}"
  end
end

问题是,即使我Net::HTTPNotFound在第一个救援块中遇到问题,我仍然在我的日志记录中看到:

--unknown exception
{url} 404 => Net::HTTPNotFound

这意味着此异常被第二个救援块捕获。这可能是什么原因?

4

1 回答 1

19

Mechanize 为 404 而不是 Net::HTTPNotFound 引发 Mechanize::ResponseCodeError。Mechanize::ResponseCodeError 上的 to_s 如下所示:

def to_s
  "#{response_code} => #{Net::HTTPResponse::CODE_TO_OBJ[response_code]}"
end

这将返回 '404 => Net::HTTPNotFound' 这使它看起来像是引发的异常。

于 2011-05-22T09:50:48.317 回答