15

我喜欢 Python 中的 Beautiful Soup 抓取库。它只是工作。Ruby 中有没有类似的东西?

4

4 回答 4

10

Nokogiri是另一个 HTML/XML 解析器。根据这些基准,它比 hpricot 快。Nokogiri 使用 libxml2,是 hpricot 的替代品。它还具有非常不错的 css3 选择器支持。

编辑:这里有一个比较 nokogiri、libxml-ruby、hpricot 和 rexml 的新基准

Ruby Toolbox在此处有一个关于 HTML 解析器的类别。

于 2009-03-12T19:25:16.753 回答
4

scRUBYt!, Rubyful-soup (不再维护), WWW::Mechanize , scrAPI等等。

或者您可以只使用 Hpricot 或Nokogiri进行解析。

于 2009-03-12T19:24:00.890 回答
3

这个来自Ruby Toolbox的页面包含一个图表,显示了各种解析器的相对流行度。

于 2009-11-11T21:46:08.490 回答
1

?不知道别人用什么...

于 2009-03-12T19:16:05.513 回答