我将有很多具有相同结构的 PDF 文档,我如何标记(或添加一些信息)文本。然后当我解析 PDF 文档时,我会知道在哪里可以通过标记的 id 找到指定的值。
如何获得 Apache-Tika 或 PDFBox 标记的属性?
例如:创建带有标记为全名的文本字段的 pdf 文件,然后我对其进行解析并尝试找到一个标记为全名的值。
我将有很多具有相同结构的 PDF 文档,我如何标记(或添加一些信息)文本。然后当我解析 PDF 文档时,我会知道在哪里可以通过标记的 id 找到指定的值。
如何获得 Apache-Tika 或 PDFBox 标记的属性?
例如:创建带有标记为全名的文本字段的 pdf 文件,然后我对其进行解析并尝试找到一个标记为全名的值。