2

我正在使用 docx 文档,我需要根据“标题 1”样式的标题将文档解析为多个部分。因此,如果我有这样的文档(标记是伪代码):

<doc>
<title style>Doc Title</title style>
<heading1>First Section</heading1>
...
<heading2>Second Section</heading2>
...
<heading3>Third Section</heading3>
...
</doc>

我想把它分成一个有四个部分的文档,第一个部分是第一部分之前的内容。我认为一旦您熟悉了 Open XML,这可能非常简单,但我不是。

TIA。

4

1 回答 1

2

哇......整天对这个问题没有任何看法。好吧,我想通了,以为我会分享财富。我不能直接分享代码,但它只是三个嵌套循环,一个循环遍历段落,然后运行段落,然后是样式。每个的 XPath 是:

.//w:p
./w:pPr
./w:pStyle

找到具有您喜欢的样式的运行后,您会弹出一个级别以获取第一次运行,其中将包含样式文本。从那里开始,它只是 Comp Sci 101 的东西。我认为真正的突破是甚至不尝试弄乱 Open Xml SDK(除了 IO 打包的东西),而是直接进行 XML 操作。

于 2010-04-20T22:49:36.187 回答