0

我正在寻找解析一些旧的 html,这些旧的 html 有很多现在可以用 CSS 完成的无关标签 - <b>,<font>等。我正在使用 Hpricot 来解析它,但我想得到最里面的“inner_html” - 怎么做用 Hpricot 做那个?例如,假设我使用 Hpricot 抓取<table>我循环通过的所有元素以获取行和单元格,但我想获取单元格内的数据,但它们不能有额外的标签或类似的东西<b><font ...>1,000</font></b>- 有没有技巧只拿出“1,000”?

谢谢,

4

1 回答 1

1

我不确定这是否完全是您想要的,但您可能想查看inner_text方法。它将返回与 inner_html 相同的内容,除了将删除所有 HTML 元素。

于 2010-10-09T03:13:30.157 回答