ruby - 使用海葵从网站获取 url 列表时出错

Question

代码：

require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
  anemone.on_every_page do |page|
    puts page.url
  end
end

当我尝试这段代码时，我应该得到该网站上所有 url 的列表，但我得到的只是网站的名称。可能是什么错误以及如何获取所有网址的列表？

score 0 · Accepted Answer

我猜海葵只是不能跟随重定向或类似的东西，因为“http://example.com”将我重定向到其他站点。您是否尝试过抓取其他网站？例如，http ://stackoverflow.com。

1 回答 1