我正在尝试使用 R 中 XML 包中的 xpathApply 函数从 html 文件中提取某些数据。但是,当我在 html 文档的某些父节点上使用 xpathApply 后,结果对象的类变为 XMLNodeSet,我无法在此类对象上进一步使用 xpathApply,因为出现此错误消息:“UseMethod("xpathApply") 中的错误:没有适用于“XMLNodeSet”类对象的“xpathApply”方法</p>
这是我试图复制我的问题的 R 脚本(这个例子只是一个简单的表,我知道我可以使用 readHTMLtable 函数,但我需要使用更底层的函数来工作,因为我的实际 html 比这个简单的更复杂桌子):
library(XML)
y <- htmlParse(htmlfile)
x <- xpathApply(y, "//table/tr")
z <- xpathApply(x, "/td")
这是“html文件”:
<table>
<tr>
<td> Test1.1 </td> <td> Test1.2 </td>
</tr>
<tr>
<td> Test1.3 </td> <td> Test1.4 </td>
</tr>
</table>
使用 xpathApply 后是否有任何方法可以在节点上进一步工作?或者还有其他好的选择来处理节点中的数据吗?