Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 tabula-py 通过提供一个确切的区域来从 pdf 中提取表格,该区域可以保持它们的位置。
tabula-py 使用 72 dpi 区域坐标和点,但我有 300 dpi 像素坐标,这些坐标是从经过训练的 ML 模型中提取的。
有没有一种方法可以在 tabula-py 表格提取中使用我的区域(具有 300 dpi 像素位置)和他们的方法(read_pdf 或 convert_into 您传递具有 72 dpi 点坐标的区域)