我知道 PDF 不是用于编辑的,但我有一个要求,我需要解析 PDF 并对其进行修改以将所有文本元素转换为超链接。有没有办法做到这一点?
非常感谢,
我知道 PDF 不是用于编辑的,但我有一个要求,我需要解析 PDF 并对其进行修改以将所有文本元素转换为超链接。有没有办法做到这一点?
非常感谢,
将文本元素转换为超链接涉及多个操作:
您必须应用文本提取,同时提取文本位置,而不仅仅是纯文本。
在提取的带有位置的文本中,您必须找到要创建超链接的所有文本部分。
找到它们后,获取它们的位置并添加适当的注释以使它们超链接。
可以在 iText 中实现带有位置的文本提取LocationTextExtractionStrategy
(参见这个答案;即使它是为 iTextSharp 编写的,同样的原则也适用)和 PDFBox overriding PDFTextStripper.writeString(String, List<TextPosition>)
。