0

我可以使用 iText API 来比较两个 PDF 文件吗?我已经通过stackoverflow上的各种方法来比较PDF文件,例如工具,一些实用程序,例如imagemagick等。我希望比较的PDF是带有图表,表格和文本等的财务报告。我们必须比较大量文件并想通过命令行实用程序来完成。有一个 ComparePDF 命令行工具,但它只输出两个文件是否包含差异。我们想打印一份文件差异日志。我们可以通过 iText 做到这一点吗?

4

2 回答 2

6

你想比较什么?iText 可用于比较结构和语法,但是... 两个不同的 PDF 看起来与人眼相同,但内部可能具有完全不同的结构和语法。

在 iText,我们编写了使用 GhostScript 创建每个页面图像的 JUnit 测试。这些图像在每个像素的基础上相互比较。

我们还在 JUnit 测试中使用 iText,但这些测试更多地关注结构和语法,而不是内容。

于 2012-12-04T12:51:27.510 回答
0

PDF比较需要使用Myers O(ND) diff算法,itext或pdfbox api没有提供pdf比较的方法,可以使用itext提取这些文件的文本和坐标,以后使用Myers O(ND) diff算法找出差异并突出显示变化。

于 2018-04-06T12:11:39.003 回答