问题标签 [excalibur-py]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

3 问题

0 投票

1 回答

305 浏览

python-3.x - 从Python中的pdf文件中提取固定大小和位置表

假设我有许多与此处类似的 pdf 文件：

我想提取下表并保存为 excel 文件：

我可以使用包excalibur手动提取表并保存 excel 文件。

使用 pip3安装Excalibur后，我使用以下命令初始化元数据数据库：

$神剑初始化数据库

然后使用以下命令启动网络服务器：

$ excalibur 网络服务器

然后转到 http://localhost:5000 并开始从 PDF 中提取表格数据。

我想知道是否可以使用 python 脚本自动为多个 pdf 文件执行此操作，这些文件包含excalibur-py、camelot、pdfminer等包，因为表格的大小和位置对于同一个城市的报告是固定的。

您可以从此链接下载其他报告文件。

非常感谢提前。

2021-04-13T03:06:19.877

0 投票

3 回答

748 浏览

python - 没有名为“camelot.ext”的模块

我一直在尝试从 pip 安装后运行 Excalibur，它要求我安装 camelot，之后弹出此错误，

此输出显示当我尝试运行此模型、initdb 或 webserver 命令时，我尝试了很多方法来解决，但没有什么对我有用

python python-3.x python-camelot excalibur-py

2021-10-26T06:38:57.020

0 投票

1 回答

60 浏览

python - Camelot 依赖项 - 需要熊猫吗？

早上好，

我正在让 Camelot 获准在我的办公室使用，以帮助完成一些项目，但需要在安装前提供完整的依赖项列表。

Camelot 仅将 Tkinter 和 Ghostscript 列为依赖项，但提到了 pandas 数据帧的使用，据我了解，这是一个单独的模块，也是必需的。

有人可以帮助我了解熊猫如何融入 Camelot-py 吗？

它内置在 Camelot 中吗？或者我是否也需要请求安装熊猫？

感谢您的帮助。

python pandas python-camelot excalibur-py

2021-11-09T13:23:09.937

1 2 3 4 5 6 7 8 9 10

问题标签 [excalibur-py]

python-3.x - 从Python中的pdf文件中提取固定大小和位置表

python - 没有名为“camelot.ext”的模块

python - Camelot 依赖项 - 需要熊猫吗？

Reference