5

目前,我有一系列图像 (PNG),并且每个图像都有其内容的未格式化文本版本。我想制作一个 PDF,其中每个图像都成为结果 PDF 的一整页,相应的文本也以某种方式附加到页面上,因此搜索某些单词会将您带到带有该文本的页面,即使文本永远不会直接显示。

这是一个一次性的工作,因此它不必整洁或可扩展。我可以使用 Linux 系统上常用的任何语言,或常用的命令行工具。(我也有一个带有 Acrobat 的 Windows 系统,虽然有将近一千张图像,所以手动操作是行不通的。)

4

1 回答 1

1

尝试的一种选择是使用 Java 和Apache-Fop生成 PDF ,但这可能比您想要做的工作更多。

使用 iText 可能会做得更好;将 PNG 添加到 iText 以生成 PDF 的示例

您将需要确定如何生成Layer放置可搜索文本的位置;我无法就如何执行此步骤向您提供建议。

是您如何判断 PDF 是否包含文本的方法,这可能会帮助您构建一个。

于 2013-01-29T19:47:45.753 回答