2

取由xml2::read_html/生成的任何假设节点rvest,例如:

require(xml2); require(rvest)
doc = read_html('https://www.w3.org/TR/html4/intro/intro.html')
e = html_node(doc, '.subtoc')

有什么办法可以转换e回html?我能做的最接近的事情是:

xml2::write_html(e, 'e.html')
head(readLines('e.html'))
[1] "<div class=\"subtoc\">"                                               
[2] "<p><strong>Contents</strong></p>"                                     
[3] ""                                                                     
[4] "<ol>"                                                                 
[5] "<li>"                                                                 
[6] "<a class=\"tocxref\" href=\"#h-2.1\">What is the World Wide Web?</a> "
4

1 回答 1

0

您可以尝试将节点转换为字符,然后重复 read_html 代码。

newdoc <-read_html(as.character(e))

write_html(newdoc, e.html)

这将创建一个可读的 html 文档。

于 2018-03-09T21:23:24.397 回答