1

我正在尝试从数千个相同的 Excel 2007/2010 文件中删除数据。我更喜欢使用抓取技术来做到这一点。是否可以抓取 Excel 文件,因为据我所知,该文件基本上是某种 XML 格式。

那么,是否可以将 Excel 文件转换为 XML 或其他一些标记格式?

4

2 回答 2

1

XLSX 格式实际上是一个 ZIP 文件,但具有不同的扩展名。如果您使用您喜欢的 zip 程序解压缩它,您会发现工作表数据位于 xl\worksheets 中。每个工作表都保存为单独的 XML 文档。您应该能够按照 Michael 的建议使用 XSLT 来提取您需要的数据。

于 2010-10-15T19:08:34.860 回答
0

默认情况下,Excel 2010 文件采用 XML 格式。那么您的 Excel 文件当前采用什么文件格式(即,它们具有什么扩展名)?你的问题在这个问题上有些模棱两可。如果它们已经在 XML 中,您可以使用 XSLT 来抓取它们。

于 2010-10-15T18:58:00.000 回答