我正在尝试从数千个相同的 Excel 2007/2010 文件中删除数据。我更喜欢使用抓取技术来做到这一点。是否可以抓取 Excel 文件,因为据我所知,该文件基本上是某种 XML 格式。
那么,是否可以将 Excel 文件转换为 XML 或其他一些标记格式?
XLSX 格式实际上是一个 ZIP 文件,但具有不同的扩展名。如果您使用您喜欢的 zip 程序解压缩它,您会发现工作表数据位于 xl\worksheets 中。每个工作表都保存为单独的 XML 文档。您应该能够按照 Michael 的建议使用 XSLT 来提取您需要的数据。
默认情况下,Excel 2010 文件采用 XML 格式。那么您的 Excel 文件当前采用什么文件格式(即,它们具有什么扩展名)?你的问题在这个问题上有些模棱两可。如果它们已经在 XML 中,您可以使用 XSLT 来抓取它们。