0

我有几百个 XML 文件。它们可能是从/向 Excel 生成的。我想把它读成 R 或转换成 CSV。所有文件的标题如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
 xmlns:o="urn:schemas-microsoft-com:office:office"
 xmlns:x="urn:schemas-microsoft-com:office:excel"
 xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
 xmlns:html="http://www.w3.org/TR/REC-html40">
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">

我总是可以编写解析器,但想避免这样做。我没有 Excel

4

1 回答 1

2

在“R Data Import/Export”手册(随 R 一起安装的免费手册之一)中有一章是关于从 Excel 电子表格中读取数据的。如果上述 XML 文件是从最新版本的 Excel 中保存的电子表格,那么其中一些工具应该很容易读取它们。我可能会从 RODBC 包或 XLConnect 包开始。

如果这些都不起作用,那么 XML 包至少应该使编写解析器更容易。

于 2013-01-18T22:28:08.493 回答