问题标签 [python-pdfreader]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2950 浏览

python - PDF文档:如何使用python验证数字签名?

我们正在做 RPA 项目并使用 python 将数据 PDF 提取到 excel 中。现在我们需要验证PDF 中的数字签名。

0 投票
1 回答
1894 浏览

python - 如何使用python从pdf中提取一些数学表达式?

我有一个pdf,其中包含这样的数学方程式

我正在尝试从 pdf 文件中提取客观问题,并使用 python 将它们转换为 csv 文件,这样表格的每一行都包含一个问题,每列中有四个选项和一个正确的选项(总共六列)。但是那个pdf也有那些我不能把它们写成csv文件的数学方程。是否可以将这些方程写在我的 csv 文件中,就像它们在 pdf 文件中一样?

0 投票
1 回答
1662 浏览

python - 在将数据从 pdfplumber 导入到 .csv 文件时需要帮助

我使用 pdfplumber 从 pdf 中提取文本,但是当我尝试使用 to_csv 导入数据时抛出 #me 错误。在将数据导入 .csv 时需要帮助

没有得到导入文件中的数据只是得到了一个空文件

0 投票
2 回答
1028 浏览

python - Python 不使用 pyPDF2 打印 PDF

我尝试打印 pdf 文档的页面:

但我只得到很多空白,没有错误消息。会不会是 PyPDF2 不支持这个 pdf 版本(my.pdf)?

这解决了它(打印文档的所有页面)。谢谢

0 投票
1 回答
481 浏览

python - 如何在 MySQL 数据库中存储 PDF 而无需在 Python 中生成 PDF 文件

所以基本上我在 MySQL 数据库中有一个 base64 编码的 PDF 数据,我想操作该数据(更新 PDF 文件数据的表单字段),之后不创建/写入我想要存储该操作/更新的数据的 PDF 文件到一个数据库。Python 代码如下所示。

在这里我正在使用PyPDF2并且代码正在运行

注意:另请阅读代码中的注释

提前致谢。

0 投票
0 回答
1269 浏览

python - 如何在python中从银行对帐单PDF中读取数据?

我必须从包含文本和表格的银行对帐单 PDF 中读取数据。

我尝试了一些通过堆栈溢出提供的解决方案,但大多数都出现错误。

从以下许多代码中,我得到了一个代码,但没有得到预期的结果。

将输出作为 -

但是想要来自 PDF 文件的数据,而不是关于 PDF 文件的数据。

有人可以为我提供从银行对帐单 PDF 中读取数据的解决方案吗?

0 投票
3 回答
385 浏览

python - Django在某些页码上打开pdf

我正在尝试创建一个 PDF 分析网络应用程序,但我被卡住了。我想允许用户打开其中有超过 300 页的 pdf 的某个页面。那么,谁能告诉我如何使用 Django 在特定页面的新选项卡中打开 pdf 文件?


编辑—— 实际上 Django 代码在 AWS 服务器上运行,我希望用户在分析后存储在我的媒体文件夹中的特定页面上查看并打开 PDF。

0 投票
0 回答
488 浏览

python - 我们如何使用 pypdf2 创建一个空白的 Pdf?

无法使用此创建pdf。

0 投票
1 回答
505 浏览

python - pdfplumber 给出 fp.seek(pos) AttributeError: 'dict' object has no attribute 'seek'

所以这是我的代码:

主要的()

其中 combineparser.py 有两个功能:

我有一个随机散布的 pdf 和文本文件的目录。我正在尝试使用装饰器@file_discriminator 来运行函数 advparser,该函数使用 pdfplumber 和后续处理从目录中的 pdf 文件中的 pdf 文件中提取可用信息;和 vikparser 对文本文件执行常规文本文件处理。每个都应该生成一个名为 Specimen_Output 的字典。当 advparser 是一个单独的 .py 文件作为 advparser(file) 运行时,我得到了正确的结果,导入 askopenfilename 而不是它的复数,并使用 advparser(file = askopenfilename()); vikparser 也是如此(它正在查看带有 readlines 的文本文件)。但是,当我尝试从主模块执行此操作并使用父函数调用它们时,我无法让它工作。我'

当我修复因改变事物而产生的任何错误时,这是​​我得到的最常见的错误:

我究竟做错了什么?它在谈论什么 dict 对象,当我尝试从 askopenfilename() 单独调用每种类型时,为什么 pdfplumber 没有这个问题?我是一个新手编码器,整天都在扯头发。谢谢!

0 投票
1 回答
322 浏览

python-3.x - 无法使用 PyPDF2 在 jupyter notebook 上打开我的 pdf 文件

我尝试打开一个 pdf 文件,该文件使用已安装的 PyPDF2 模块下载,如下所示:

它给了我一个 filenotfound 错误消息: