在我的工作中,我必须通过门户网站上授予的用户访问权限对外部组织共享的数据进行一些分析。那里有各种报告,我可以查看和下载多种格式的报告。其中两种格式非常有用,即 MS Excel 和“带有报告数据的 XML 文件”。Excel 文件通常经过大量格式化(带有小计、合并单元格等)以适应 Excel 用户的目的。将这些 Excel 文件转换为数据框/表格通常很麻烦。因此,我更喜欢下载“xml”文件,然后通过解析它 -> 将其保存在 csv 中,然后在R
.
但是,每当我尝试将xml
文件直接解析为 R (以避免干预转换为 csv 步骤)时,我永远不会成功。到目前为止,我已经尝试XML
xml2
过 R 中的库,但无济于事。
最近我尝试了这段代码。
library("XML")
library("methods")
setwd("C:\\Users\\Administrator\\Desktop\\")
res <- xmlParse("Skil.xml")
> res <- xmlParse("Skil.xml")
xmlns: URI RptSancDig_VoucherCompilationSheet is not absolute
rootnode <- xmlRoot(res)
rootsize <- xmlSize(rootnode)
> rootsize
[1] 2
xmldataframe <- xmlToDataFrame("Skil.xml")
> xmldataframe <- xmlToDataFrame("Skil.xml")
xmlns: URI RptSancDig_VoucherCompilationSheet is not absolute
> xmldataframe
Textbox24 Textbox63 DDOName_Collection
1 <NA> <NA> <NA>
2
只需提一下文件大小Skil.xml
约为 12.1 Mb,并在 Excel 中成功解析。
我也尝试过read_xml()
的功能,xml2
但无济于事。
我很乐意分享一个示例文件来尝试,但我无法这样做。此外,我也无法生成那种 xml 格式的示例文件。
有人可以帮忙吗?