我正试图从棕榈滩县治安官办公室的警察记录纸上获取逮捕数据。
我将搜索范围限制在西棕榈滩市,追溯数据(1974 年 10 月 31 日)。
我正在使用火狐。
当我得到结果时,我打开 FireBug,检查 HTML 选项卡,我可以从页面中看到我想要的信息(即被捕者的姓名、逮捕地址、指控等)。
我检查了 Net>>XHR>>Post 选项卡以找到 POST 请求参数,并将其放入我的代码中,但它返回的 HTML 不包含我正在寻找的重要信息。
有谁知道我是否做错了,或者该网站是否不可抓取?这是我的代码:
require 'rubygems'
require 'nokogiri'
require 'restclient'
require 'open-uri'
blotterURL = 'http://www.pbso.org/index.cfm?fa=blotter'
city = "west palm beach"
fromrec = 1
if page = RestClient.post(blotterURL, {'city_name'=>city, 'fromrec'=>fromrec})
puts Nokogiri::HTML(page)
end