我正在寻找解析一些旧的 html,这些旧的 html 有很多现在可以用 CSS 完成的无关标签 - <b>
,<font>
等。我正在使用 Hpricot 来解析它,但我想得到最里面的“inner_html” - 怎么做用 Hpricot 做那个?例如,假设我使用 Hpricot 抓取<table>
我循环通过的所有元素以获取行和单元格,但我想获取单元格内的数据,但它们不能有额外的标签或类似的东西<b><font ...>1,000</font></b>
- 有没有技巧只拿出“1,000”?
谢谢,
本