问题标签 [excalibur-py]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
305 浏览

python-3.x - 从Python中的pdf文件中提取固定大小和位置表

假设我有许多与此处类似的 pdf 文件:

我想提取下表并保存为 excel 文件:

在此处输入图像描述

我可以使用包excalibur手动提取表并保存 excel 文件。

使用 pip3安装Excalibur后,我使用以下命令初始化元数据数据库:

$神剑初始化数据库

然后使用以下命令启动网络服务器:

$ excalibur 网络服务器

然后转到 http://localhost:5000 并开始从 PDF 中提取表格数据。

我想知道是否可以使用 python 脚本自动为多个 pdf 文件执行此操作,这些文件包含excalibur-pycamelotpdfminer等包,因为表格的大小和位置对于同一个城市的报告是固定的。

您可以从此链接下载其他报告文件。

非常感谢提前。

0 投票
3 回答
748 浏览

python - 没有名为“camelot.ext”的模块

我一直在尝试从 pip 安装后运行 Excalibur,它要求我安装 camelot,之后弹出此错误,

此输出显示当我尝试运行此模型、initdb 或 webserver 命令时,我尝试了很多方法来解决,但没有什么对我有用

0 投票
1 回答
60 浏览

python - Camelot 依赖项 - 需要熊猫吗?

早上好,

我正在让 Camelot 获准在我的办公室使用,以帮助完成一些项目,但需要在安装前提供完整的依赖项列表。

Camelot 仅将 Tkinter 和 Ghostscript 列为依赖项,但提到了 pandas 数据帧的使用,据我了解,这是一个单独的模块,也是必需的。

有人可以帮助我了解熊猫如何融入 Camelot-py 吗?

它内置在 Camelot 中吗?或者我是否也需要请求安装熊猫?

感谢您的帮助。