html - 使用 Hpricot 和 Ruby 解析 HTML - 获取最里面的 html？

Question

我正在寻找解析一些旧的 html，这些旧的 html 有很多现在可以用 CSS 完成的无关标签 - ,等。我正在使用 Hpricot 来解析它，但我想得到最里面的“inner_html” - 怎么做用 Hpricot 做那个？例如，假设我使用 Hpricot 抓取<table>我循环通过的所有元素以获取行和单元格，但我想获取单元格内的数据，但它们不能有额外的标签或类似的东西1,000- 有没有技巧只拿出“1,000”？

谢谢，
本

score 1 · Accepted Answer

我不确定这是否完全是您想要的，但您可能想查看inner_text方法。它将返回与 inner_html 相同的内容，除了将删除所有 HTML 元素。

html - 使用 Hpricot 和 Ruby 解析 HTML - 获取最里面的 html？

1 回答 1

Related

Reference