我正在使用 Camelot 阅读完整的 PDF,并从每个 PDF 中提取大约 112 个属性。
我使用表格区域来提取属性
test_variable = camelot.read_pdf(filename, flavor='stream',
table_areas=['38, 340 ,50, 328'])
问题是所有文档中相同属性的表格区域不是恒定的。有时我会在另一个文档中的 x 或 y 坐标下几个像素处找到相同的属性。
test_variable = camelot.read_pdf(filename, flavor='stream',
table_areas=['38,350,50,338'])
无论提取任何文档,有没有办法从同一区域获取确切的属性?