0

所以我正在使用这个:

Net::HTTP.get(URI.parse(url))

完美运行。

我遇到的问题是它获取的页面是用 head、html、body 等标签格式化的。正文中有一个标签元素,其 id 为“结果”我只想让我返回“结果”的文本。不是所有的 html 格式。

这可以做到吗?

4

1 回答 1

3

好吧,要仅获取 HTML 内容的一部分,您必须使用 HTML 解析器,在本例中为Nokogiri 。

doc = Nokogiri::HTML(open(url))
doc.css('#Result').each do |re|
  puts re.to_s
  #puts re.content
end
于 2013-05-13T19:12:20.450 回答