我正在尝试创建一个程序来读取 .docx 文件并将其内容发布到博客/论坛以供个人使用。我终于弄清楚了如何使用 libcurl 来做(我想的)是程序中更难的部分。现在我只需要阅读 .docx 文件,但遇到了障碍。我似乎找不到任何有关如何执行此操作的文档。有任何想法吗?
问问题
18250 次
2 回答
7
最简单的方法是使用 Word 来执行此操作。它对许可有限制。
SO问题Creating, opens and printing a word file from C++有一些很好的参考。
编辑:
根据这些问题/答案可以解压Open XML文件并直接处理XML文件:
如果您使用 .NET,则需要阅读更多 (C#) 问题:
于 2009-07-21T19:39:45.550 回答
1
如果你想留在开源世界,OpenOffice 3 应该能够处理 .docx 文件。有一个项目可以实现多种语言的 API,我真的不知道它有多完整或复杂。
PHP 中有一个脚本可以将 .docx 转换为纯文本。也就是说,如果您不害怕所有文档都是俄语的)。这可能是另一种选择(使用系统调用触发 php 脚本并从文件中解析结果)
于 2009-07-21T20:14:24.827 回答