java - 是否有可以从给定坐标中提取文本的 PDF 解析库？

Question

早安，伙计们。我被分配了一项任务，我应该根据给定的字段和部分规范从 PDF 文件（银行发票）中提取文本。此规范在 YAML 文件中给出。字段表示为一组两个坐标 - 文本所在矩形的左上角和右下角，以及字段的名称。我正在使用 SnakeYAML 将此信息加载到对象中。到目前为止，我一直很成功。对于下一部分，我必须使用这些数据从 PDF 中提取文本，嗯……我有点卡在这里。一方面，我还无法决定使用什么 PDF 解析库。您能否向我推荐一个适合我的任务的 PDF 解析库，我应该如何完成上述任务？谢谢！

score 2 · Accepted Answer

2

PDF Box能够从给定区域提取文本。看看PDFTextStripperByArea！

于 2011-09-02T09:09:10.403 回答

java - 是否有可以从给定坐标中提取文本的 PDF 解析库？

1 回答 1

Related

Reference