在我工作的地方,我需要从中提取信息的数百个 xlsx 文件(使用 Office 2010 Starter 创建)。这只是一次性的工作,所以问题是哪种方式最快。现有工具?编程解决方案?
信息只是字符串,格式无关紧要。这些文件包含客户数据。每位客户一份文件。在你问之前,是的,这是一个愚蠢的系统——我们正在放弃它。因为我们现在要迁移到一个新系统,所以我们需要将现有的客户数据导出为一个 CSV 文件,该文件可以导入到新系统中。
如果我要编写一个计算机程序来执行此操作,我需要能够访问每个文件中的第一个工作表,并且能够读取任何给定单元格(A1、C5 等)的内容。就是这样。
由于 xlsx 文件只是一些压缩的 XML 文件,因此一种方法是编写解压缩和解析 XML 文件的代码。这听起来像是一个非常耗时的解决方案,所以如果存在免费库,我宁愿使用它。
在这里可能有用的语言中,我最擅长 C++ 和 C,但也做过一些 C#、VB6 和 VB.NET,以及一点点 Python。