-2

我正在尝试抓取一些数据。B 是要抓取 1000 个项目所需的页数 - 每页有 22 个。

usernum = 1000
b = usernum.to_i/22
Array.new(b) {|b| b+1}

我有一个页数数组(1000/22 = 45 int.) - [1,2,...44,45] 我需要抓取,每个数组元素都与 Nokogiri 下载的页面有关。我不确定如何进行。

www.google.com&page=1
www.google.com&page=2

等在这​​种情况下,它需要到达“www.google.com&page=45”

是否可以将前缀附加到数组的每个项目?如果是这样,格式化数组并按时间顺序下载每个页面,或者在外部文本文件中编译 URL 列表并将它们加载到方法中是否有意义?我将尝试添加线程。

4

1 回答 1

0

你可以循环而不是创建一个数组吗?

(1..b).each do |page|
  url = "http://google.com?page=#{i}"
  # .. fetch the page
end
于 2013-03-25T18:02:57.603 回答