0

我想访问 Office 2003 文件(.doc、.xls 和 .ppt)以提取文本和一些元数据(字数、工作表数、图片、模板等)。我可以使用 Open XML SDK for office 2007 文档来做到这一点。但是,此提取将在无法安装 Microsoft Office 等应用程序的服务器上进行(这就是我无法使用 Office 的 Interop 的原因)。我试过 NPOI,但实际上它只支持 .xls 文件。我发现的其他库不是开源的,我不能在我的工作中使用它......我下载了 NPOI Scratchpad 但代码非常“原始”,我不能在我的工作中使用它。您是否有其他想法可以从 Office 2003 文档中获取文本和元数据?我不是一个非常有经验的程序员,我正在使用 C#(但是,如果在 C++ 中有任何解决此问题的方法,我可以考虑使用它)。谢谢。

4

1 回答 1

1

有很多库,例如:

  • ClosedXML (Office 2007)
  • EPPlus (Office 2007)
  • Aspose 单元格(Office 97-2010,我用这个)

我不知道任何支持 Office 2003 格式的免费库。

祝你好运

于 2012-04-05T09:50:48.583 回答