3

我正在尝试将链接列表存储到数组中,然后遍历它们。

我有这个 rake 任务:https ://gist.github.com/farooqyousuf/5268460

目前,rake 任务通过一个页面并获取我需要的一些链接,但它并没有获取所有链接。

问题是第 17 行。

我需要它来做,page2.search('.subtitleLink a').each但我不能.each在最后加上这个:.map{|a| page2.uri.merge a[:href]}.each do |uri|。它给出了一个错误。

所以我想我需要存储page2.search('.subtitleLink a').each到一个数组中,然后在每次迭代(.map{|a| page2.uri.merge a[:href]}.each do |uri|)上执行此代码对其进行迭代,但我的尝试并没有成功。

选项1:

我试过这个:

page2.search('.subtitleLink a').each do |x|      
  x.map{|a| page2.uri.merge a[:href]}.each do |uri|
    page4 = agent.get uri
  end   

但我得到这个错误:

rake aborted!
can't convert Symbol into Integer
/Users/farooqyousuf/Projects/HalalSpot/lib/tasks/something.rake:19:in `[]'

选项 2:

                page2.search('.subtitleLink a').each do |x|

                    blah = URI.parse(URI.encode(x.to_s.strip))
                    page4 = agent.get blah

               end    

结果是:

rake aborted!
bad URI(is not URI?): %3Ca%20href=%22http://www.salatomatic.com/d/Hartford+3115+Muhammad-Islamic-Center-%22%3E%3Cb%3EMuhammad%20Islamic%20Center%20%3C/b%3E%3C/a%3E

想法?

4

1 回答 1

0
puts "Enter the page url from which you wish to import data: "
page = STDIN.gets
page2 = Nokogiri::HTML(open(page))

links = page2.css('.subtitleLink a')

links.each do |link| 
 puts link['href']
 url = link['href'].strip

 page4 = agent.get url

 #do stuff

end
于 2013-03-29T05:39:13.697 回答