1

有人可以解释 Word 2003 和 2007 的 xml 结构的差异吗?干杯! :)

4

1 回答 1

3

这是一个非常广泛的问题,因此很难知道您正在寻找什么样的解释,但要点可以说是:

一种。Word 2003 XML 文件是真正的未压缩 XML 格式文件,可保存为单个未压缩文本文件。Word 2007 可以保存为该格式,但其本机格式是存储在 .zip 文件中的 XML 和其他文件(例如,图像文件)的捆绑。主文档正文、页眉/页脚、脚注、样式、文档属性等有单独的 XML 文件。但是,Word 2007 也可以保存为它自己的单一、未压缩的 XML 文件格式,通常称为“平面 OPC”。

湾。Word 2003 格式中使用的主要命名空间 URI 是http://schemas.microsoft.com/office/word/2003/wordml

主文档的 Word 2007 格式中使用的主命名空间 URI 是 http://schemas.openxmlformats.org/wordprocessingml/2006/main

使用了其他几个名称空间 URI,但在 Word 2007 的情况下,如果您希望 ZIP 中包含的每种 xml 文档类型都有不同的主名称空间。

C。Word 2003 格式在 Microsoft 之外不是 AFAIK 标准化的。Word 2007 格式是 ECMA-376 和 ISO 29500 这两个标准的基础。AFAICR 2007 符合或几乎符合 ECMA-376。只有 .zip 压缩格式是 stadardises。Flat OPC 格式不是,AFAIK 它使用的附加 XML 命名空间从未被正式记录(不是很难理解)。

由于 OOXML 格式将 Word 文档拆分为多个单独的 XML 文档和其他组件(通常称为“部分”),因此该格式还使用“关系”文件,其中包含定义部分与另一部分之间关系的 XML。例如,如果主文档包含图片,则主文档的 XML 可能需要引用图像文件部分,但通常会使用关系 ID 而不是直接命名该部分。

于 2012-05-29T19:08:48.330 回答