我想访问 Office 2003 文件(.doc、.xls 和 .ppt)以提取文本和一些元数据(字数、工作表数、图片、模板等)。我可以使用 Open XML SDK for office 2007 文档来做到这一点。但是,此提取将在无法安装 Microsoft Office 等应用程序的服务器上进行(这就是我无法使用 Office 的 Interop 的原因)。我试过 NPOI,但实际上它只支持 .xls 文件。我发现的其他库不是开源的,我不能在我的工作中使用它......我下载了 NPOI Scratchpad 但代码非常“原始”,我不能在我的工作中使用它。您是否有其他想法可以从 Office 2003 文档中获取文本和元数据?我不是一个非常有经验的程序员,我正在使用 C#(但是,如果在 C++ 中有任何解决此问题的方法,我可以考虑使用它)。谢谢。
问问题
230 次