问题标签 [excalibur-py]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 从Python中的pdf文件中提取固定大小和位置表
假设我有许多与此处类似的 pdf 文件:
我想提取下表并保存为 excel 文件:
我可以使用包excalibur手动提取表并保存 excel 文件。
使用 pip3安装Excalibur后,我使用以下命令初始化元数据数据库:
$神剑初始化数据库
然后使用以下命令启动网络服务器:
$ excalibur 网络服务器
然后转到 http://localhost:5000 并开始从 PDF 中提取表格数据。
我想知道是否可以使用 python 脚本自动为多个 pdf 文件执行此操作,这些文件包含excalibur-py、camelot、pdfminer等包,因为表格的大小和位置对于同一个城市的报告是固定的。
您可以从此链接下载其他报告文件。
非常感谢提前。
python - 没有名为“camelot.ext”的模块
我一直在尝试从 pip 安装后运行 Excalibur,它要求我安装 camelot,之后弹出此错误,
此输出显示当我尝试运行此模型、initdb 或 webserver 命令时,我尝试了很多方法来解决,但没有什么对我有用
python - Camelot 依赖项 - 需要熊猫吗?
早上好,
我正在让 Camelot 获准在我的办公室使用,以帮助完成一些项目,但需要在安装前提供完整的依赖项列表。
Camelot 仅将 Tkinter 和 Ghostscript 列为依赖项,但提到了 pandas 数据帧的使用,据我了解,这是一个单独的模块,也是必需的。
有人可以帮助我了解熊猫如何融入 Camelot-py 吗?
它内置在 Camelot 中吗?或者我是否也需要请求安装熊猫?
感谢您的帮助。