2

我正在尝试找到一种方法来生成带有黑线的 pdf 文件(即突出显示文件的两个版本之间的差异,类似于 MS Word 中的“比较和合并文档”功能)。

到目前为止,我已经尝试了几种不同的方法,但结果并不理想: 1) 使用 Adob​​e Acrobat 的“比较文档”功能。这种方法的主要问题是一些文本被解释为图像(为什么?文本可以被复制/粘贴..),导致非常粗粒度的差异。

2) 将 .pdf 文件转换为 Word 文档并使用 Word 的比较功能。这种方法的问题是从 .pdf -> .doc 的转换不可靠(.doc 文件中缺少一些文本),以及一些误报差异(格式化字符和用于创建 Word 文档的 Acrobat 等)。

3) 一款名为 Workshare (http://www.workshare.com/products/) 的软件。这.. 严重损坏了.. 文件处于无法使用的状态。

我们使用在 Django Web 框架中运行的 ReportLab 库以编程方式生成 .pdf 文件。因此,以编程方式生成带黑线的 pdf 是可能的,并且可能会产生最佳结果,但这将是一项更耗时的任务。

有什么建议么?

(真的吗?stackoverflow 不允许我使用名为“blacklining”的标签?真的吗??!)

4

0 回答 0