我喜欢 Python 中的 Beautiful Soup 抓取库。它只是工作。Ruby 中有没有类似的东西?
Tim
问问题
8768 次
4 回答
10
Nokogiri是另一个 HTML/XML 解析器。根据这些基准,它比 hpricot 快。Nokogiri 使用 libxml2,是 hpricot 的替代品。它还具有非常不错的 css3 选择器支持。
编辑:这里有一个比较 nokogiri、libxml-ruby、hpricot 和 rexml 的新基准。
Ruby Toolbox在此处有一个关于 HTML 解析器的类别。
于 2009-03-12T19:25:16.753 回答
4
有scRUBYt!, Rubyful-soup (不再维护), WWW::Mechanize , scrAPI等等。
或者您可以只使用 Hpricot 或Nokogiri进行解析。
于 2009-03-12T19:24:00.890 回答
3
这个来自Ruby Toolbox的页面包含一个图表,显示了各种解析器的相对流行度。
于 2009-11-11T21:46:08.490 回答
1
杏?不知道别人用什么...
于 2009-03-12T19:16:05.513 回答