3

代码:

require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
  anemone.on_every_page do |page|
    puts page.url
  end
end

当我尝试这段代码时,我应该得到该网站上所有 url 的列表,但我得到的只是网站的名称。可能是什么错误以及如何获取所有网址的列表?

4

1 回答 1

0

我猜海葵只是不能跟随重定向或类似的东西,因为“http://example.com”将我重定向到其他站点。您是否尝试过抓取其他网站?例如,http ://stackoverflow.com。

于 2012-09-04T09:11:49.150 回答