3

我想从 MS Word 文档中提取文本信息。提取的信息包括文本的位置、页码和样式。有谁可以建议我我该怎么做?什么图书馆可以支持我这样做?谢谢

4

1 回答 1

1

我建议您使用 OpenXML SDK 2.0 版。您可以查看下面的博客以了解如何了解提取内容。 http://blogs.msdn.com/b/ericwhite/archive/2009/02/16/finding-paragraphs-by-style-name-or-content-in-an-open-xml-word-processing-document。 aspx

或有关 OpeXML SDK 的更多信息:

http://msdn.microsoft.com/en-us/office/aa905545.aspx

使用此库,您无需在计算机上安装 MS Word 即可提取内容或生成新的 Word 文档。

希望这有帮助。

于 2013-04-25T02:31:12.100 回答