0

我正试图从棕榈滩县治安官办公室的警察记录纸上获取逮捕数据。

我将搜索范围限制在西棕榈滩市,追溯数据(1974 年 10 月 31 日)。

我正在使用火狐。

当我得到结果时,我打开 FireBug,检查 HTML 选项卡,我可以从页面中看到我想要的信息(即被捕者的姓名、逮捕地址、指控等)。

我检查了 Net>>XHR>>Post 选项卡以找到 POST 请求参数,并将其放入我的代码中,但它返回的 HTML 不包含我正在寻找的重要信息。

有谁知道我是否做错了,或者该网站是否不可抓取?这是我的代码:

require 'rubygems'
require 'nokogiri'
require 'restclient'
require 'open-uri'

blotterURL = 'http://www.pbso.org/index.cfm?fa=blotter'

city = "west palm beach"
fromrec = 1

if page = RestClient.post(blotterURL, {'city_name'=>city, 'fromrec'=>fromrec})
    puts Nokogiri::HTML(page)
end
4

1 回答 1

1

这是因为页面正在由 ajax 更新填充。可能 Watir-webdriver 是您的最佳选择。

于 2012-06-19T00:17:17.077 回答