我正在使用 Nokogiri 分析一些 HTML,但是,我不知道如何在节点内获取原始 HTML。
例如,给定:
<tr class="tableX">
<td align="center">
<font size="2"><a href="javascript:open('9746')">9746</a></font>
</td>
<td align="center">
<font size="2">2012-06-26</font>
</td>
</tr>
当我使用这个 XPath 选择器时:
doc = Nokogiri::HTML(html)
nodes = doc.search("//tr[@class='tablebX']")
nodes.each do |node|
node.text # or node.content
end
结果来自node.text
和node.content
是:
9746
2012-06-26
我想在tr
块中获取所有原始 HTML,在这种情况下,它是:
<td align="center">
<font size="2"><a href="javascript:open('9746')">9746</a></font>
</td>
<td align="center">
<font size="2">2012-06-26</font>
</td>
这样做的正确方法是什么?