我有一个允许 Word 2007 文档上传的 ASP.NET 应用程序。上传后,我想解析文档文本以及审阅者的任何评论。我希望能够获得评论和评论者首字母/姓名。
有免费的库可以做到这一点吗?我不喜欢自动化 Word,因为这个过程需要有一定的可扩展性。
DocX(检查 codeplex)可能会满足您的需求。我知道您正在寻找免费产品,但如果您发现您需要的功能(例如 97-2003 支持)比免费产品中的更多,请查看 Aspose 的产品。我依靠他们的 .NET 套件来开发许多商业应用程序,总的来说,我对它非常满意。
如果您要求您的用户上传 Word 2007 DOCX 文件(相对于 Word 2003 .doc 文件),您可以使用System.IO.Packaging
WindowsBase.dll 中的 API 来读取 Word 2007 文件中的 XML(参见此处)