0

我成功地使用免费版本的 phpdocx php 库将 docx 文件转换为 html 文件。

问题是输出通常包含如下所示的行:

<span style=" font-family:;">This line is</span><span style=" font-family:;">completely b</span><span style=" font-family:;">roken</span><span style=" font-family:;">b</span><span style=" font-family:;">ecause of the random span tags

和在浏览器中看到的一样:

“由于随机跨度标签,这条线完全被破坏了”

我在清理 html 输出时尝试通过删除任何不必要的 span 标签并在每个标签周围放置空格来修复它。但当然它只修复了一些实例,实际上在其他地方中断了。使用上面的行,它会产生:

“由于随机跨度标签,这条线完全被破坏了。”

目前,防止跨度标签出现的唯一方法是选择并删除与 Word 中的句子关联的任何样式。如果您已经能够发现 Word 中的问题,那将是可以接受的,但实际上不能。

您对 phpdocx 有任何经验吗?是否有解决方案?

谢谢。

4

1 回答 1

0

呸!问题是我自己的清理工作。即以下代码:

$result = preg_replace('~>\s+<~', '><', $result);

结案。

谢谢。

于 2012-08-27T09:23:39.507 回答