我需要从网页解析表格。我在使用 Ruby 和 Nokogiri 之前已经这样做了,但是这次我的方法不起作用。这就是我正在做的事情:
response = RestClient.get "http://www.webpage.com?page=0"
doc = Nokogiri::HTML(response.body,nil,'utf-8')
doc.remove_namespaces!
table = doc.xpath(".//*[@id='contsinderecha']/form/table/tbody/tr[4]/td/table/tbody/tr[5]/td/table")
table
只是一个空数组。响应很好,如果我这样做,put response.body
我会得到网页的正文。
另外,为了获得我正在使用 firebug 的 XPath。
知道可能会发生什么吗?