15

当我对 Nokogiri 执行以下操作时:

some_html = '<img src="bleh.jpg"/>test<br/>'
f = Nokogiri::HTML(some_html)
#do some processing
puts f

它将打印整个 XHTML 文档结构以及上面的代码。

some_html我怎样才能打印/返回/获取变量中的 html 部分?


不。

f将返回:

"<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www
.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n<img src=\"bleh.jpg\">test<br>\n
</body></html>\n"

我只想要内部/片段部分:

<img src=\"bleh.jpg\">test<br>
4

2 回答 2

37

Nokogiri::HTML(...)而不是使用use解析Nokogiri::HTML::fragment(...)

asdf = Nokogiri::HTML::fragment('<img src="bleh.jpg">test<br>')
print asdf.to_html
# >> <img src="bleh.jpg">test<br>
于 2009-11-27T05:59:08.947 回答
0

'html' 部分是什么意思?

只是f.text()为了获取内部文本。

于 2009-11-04T14:48:46.433 回答