我正在尝试抓取一些数据。B 是要抓取 1000 个项目所需的页数 - 每页有 22 个。
usernum = 1000
b = usernum.to_i/22
Array.new(b) {|b| b+1}
我有一个页数数组(1000/22 = 45 int.) - [1,2,...44,45] 我需要抓取,每个数组元素都与 Nokogiri 下载的页面有关。我不确定如何进行。
www.google.com&page=1
www.google.com&page=2
等在这种情况下,它需要到达“www.google.com&page=45”
是否可以将前缀附加到数组的每个项目?如果是这样,格式化数组并按时间顺序下载每个页面,或者在外部文本文件中编译 URL 列表并将它们加载到方法中是否有意义?我将尝试添加线程。