我正在为 WordML 编写解析器。通过规范,我读到计算文档中页数的方法是Pages
读取DocumentProperties
. 如果我正确阅读了规范,DocumentProperties
应该总是在那里。
在我的 Mac 上创建测试文档时,我注意到生成的 xml 中没有Pages
orDocumentProperties
元素。我有一个w:document
,里面有一个w:body
内容。
是DocumentProperties
强制性的还是这是 Mac 的事情?
有两种不同的 Word XML 格式 - 旧的 Word 2003 XML 格式和 Office Open XML 格式,它可以保存为 .docx,其中它保存为一组 XML 和 .zip 中可能的其他文件类型容器,以及“Flat OPC”格式,它是同一事物的单文件 XML 表示。
每种格式将属性存储在不同的位置。
如果您看到一个名为 w:document 的元素,那么您实际上是以 OOXML 格式保存的。在这种格式中,“内置”属性至少保存在两个“部分”中。您通常会在名为 /docProps/app.xml 的 pkg:part 的元素中找到该元素。
至少有三个并发症: