代码:
require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.on_every_page do |page|
puts page.url
end
end
当我尝试这段代码时,我应该得到该网站上所有 url 的列表,但我得到的只是网站的名称。可能是什么错误以及如何获取所有网址的列表?
我猜海葵只是不能跟随重定向或类似的东西,因为“http://example.com”将我重定向到其他站点。您是否尝试过抓取其他网站?例如,http ://stackoverflow.com。