4

我目前正在尝试使用PHPWord库及其模板系统处理 docx 文件。我已经找到并更新了一些人(不记得名字,但它并不重要)到这个库的路径,该库可以与表一起使用(复制它的行,然后在每一行上使用 PHPWord 中的标准 setValue())。

如果我创建自己的文档,xml 中的数据是正常结构,所以要替换的变量 ${variable} 在它自己的标签中,如下所示:

<w:tbl>
    <w:tr>
        ...
         ${variable}
    </w:tr>
</w:tbl>

我简化了代码,在实际代码中还有许多其他标签描述大小、样式等。

我的问题是我必须处理来自其他人的文件,在这些文件中我被禁止进行重大更改,我得到一个文件,在某些时候他们是一个有一个空白行的表格。我添加了 ${variable} 变量并通过 PHPWord 运行它。问题是,它失败了。经过一番研究,我发现源 XML 如下所示:

    ....
        ...
         ${va

        ...
         riab

        ...
         le}
    ....

(再次大大简化,但你明白了)

这种结构对我来说是个问题,因为克隆行的函数使用 strpos()、substr() 和正则表达式来工作,并且不适用于这种结构(我无法想象这样做的优雅方式)。

所以问题是 - 有人知道为什么 docx 会这样做以及如何阻止他吗?我正在寻找通过 word 的解决方案,而不是 PHP(我需要当前功能无需太多编辑即可工作)

4

2 回答 2

5

我已经解决了很多这个问题:

在word中,文档可以这样保存

  <w:t>{</w:t>...
  <w:t>variable</w:t>
  <w:t>}</w:t>

因此,我创建了一个 JS 库,即使变量名被拆分也可以工作:Docxtemplater (works server side too)。我在开发过程中发现,如果出现以下情况,变量名称不会被拆分:

  • 要查找的文本仅由 a-zA-Z 字符组成(没有 {、$ 或 })
  • 如果文本不是一笔写成,则文本可能会被拆分:例如,如果您拼写错误,写了 ${varuable} ,然后进行编辑 -> ${variable},则 xml 内的文本为很可能会分裂。基本上你必须一笔写下你的变量名,如果你想编辑一个,完全重写变量名。

我不认为有一种方法可以在 Word 中使用一个命令来修复 docx 文档,但是重写变量以将它们写入一个 Stroke 应该可以。

于 2013-07-18T11:16:48.383 回答
2

造成这种情况的主要原因是proofErr元素。Word 借此识别出它认为拼写错误的内容并将其包装在<w:proofErr>元素中,从而不可避免地拆分原始文本。

如果这种情况发生在你身上,我推荐以下方法,这很乏味,但唯一可靠的方法:

  1. 重命名.docx.zip.
  2. 提取档案的内容。
  3. 打开word\document.xml.
  4. 进行更正(即将拆分的文本放在一起)并保存。
  5. 重命名.zip.docx.

编辑

Visual Studio 扩展允许您直接编辑 OpenXML 包的内容。这允许您跳过第 1 步和第 2 步。

于 2018-07-17T18:04:00.360 回答