我有一些巨大的 XML 文件,其中包含我在 R 中需要的信息。这些文件非常大(4GB+),以至于 xmlToList() 永远运行而没有完成。16GB RAM 就足够了。我经常使用 R,但以前从未使用过 XML。它不是 HTML。
library(XML)
doc <- xmlInternalTreeParse("big_file.xml") # Works fine
doc.list <- xmlToList(doc) # Takes forever
test <- xpathApply(doc, "//parameter", xmlValue) # Works fine, when I know the parameter name
如果 xmlToList() 有效,那么我将使用 names()、str()、summary()、doc.list[[1]][1] 等来深入研究数据并学习结构和包含哪些参数。但是对于“doc”,我不确定该怎么做。
是否有一种 R 方式将“doc”拆分为 xmlToList() 可以工作的子树?还是更好的方法?