问题标签 [pypdf2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
179 浏览

python - PyPDF2 通过使用 Python 一个接一个地附加两个或多个页面来创建单个页面

我试图找到一种方法来一个接一个地附加两个或多个页面并创建一个页面。我尝试了以下解决方案,它创建了一个单页 pdf,但是第 2 页与第 1 页重叠。

如果两页的高度为 x,我只想让这两页一个接一个地出现,但作为一个页面出现。输出 pdf 将有一个 2x 高度的单页。

0 投票
1 回答
369 浏览

python - PyPDF2 - 无法过去。一个大的损坏的文件

我正在检查文件系统中损坏的 PDF。在我正在运行的测试中,有将近 200k PDF。似乎较小的损坏文件可以正确发出警报,但我遇到了一个已损坏的 15 MB 大文件,并且代码只是无限期地挂起。我试过将 Strict 设置为 False,但没有运气。似乎是最初的开放是问题所在。我希望有一个替代方案,而不是执行线程并设置超时(我过去曾尝试过但收效甚微)。

0 投票
1 回答
1970 浏览

python - PyPDF2.PdfFileWriter addAttachment not working

Based on https://programtalk.com/python-examples/PyPDF2.PdfFileWriter/, example 2, I try to to add an attachment into a PDF file.

Here is my code I am trying to run:

When I run this code, I get: "TypeError: a bytes-like object is required, not 'str'".

If I replace

by:

I get this error: "'bytes' object has no attribute 'write'".

And if I try:

I get this error: "write() argument must be str, not bytes"

Can anyone help me?

0 投票
4 回答
13672 浏览

python - 使用 pypdf2 更改 pdf 文件的元数据

我想将元数据键值对添加到 pdf 文件的元数据中。

我找到了几年前的答案,但我认为这太复杂了。我想今天有一个更简单的方法:https ://stackoverflow.com/a/3257340/633961

我没有与pypdf2结婚,如果有更简单的方法,那么我就这样走?

0 投票
1 回答
7298 浏览

python - Python - 使用 PyPDF2 批量旋转 pdf

我一直在编写代码来批量旋转文件夹内的 pdf 文件,但我找不到迭代和更改旋转文件的目标文件夹的方法,我的目的是将新文件以相同的名称保存在另一个文件夹,谢谢

0 投票
0 回答
609 浏览

pdf - PDF 按文件大小拆分

我需要帮助,因为我需要将 pdf 文件拆分为小于 10mb 的大小。我已经设法将文件分成页面,但无法除以目标文件的大小。

下面是我用来拆分页面的代码,使用 PyPDF2 库,以及我在 stackoverflow 中收集的信息。

谢谢您的帮助。

0 投票
3 回答
8038 浏览

python - 有没有办法关闭 PdfFileReader 打开的文件?

我打开了很多 PDF,我想在解析完 PDF 后删除它们,但文件在程序完成运行之前保持打开状态。如何关闭使用 PyPDF2 打开的 PDf?

代码:

0 投票
0 回答
83 浏览

c# - 拆分具有不同页面长度的pdf

我有许多 pdf 文件,它们是从不同长度的各种其他 pdf 文件合并而来的。

当您必须检查 pdf 以找出在哪里拆分它、打开 Adob​​e 然后将文档拆分为 10-20 个不同的文档时,这会带来很多问题。

有没有办法检测 pdf 的合并位置并可能自动拆分它们。最好在 python 中使用 PyPDF2,但任何语言都可以。我只是对得到一些有用的东西感兴趣。

0 投票
2 回答
2274 浏览

python - 通过python计算pdf文档中的图像

有没有办法通过python计算pdf文档中的图像数量(JPEG、PNG、JPG)?

0 投票
2 回答
5029 浏览

python - 仅选择 PDF pypdf2 的第一页

我试图只删除多个 PDF 文件的第一页并合并为一个文件。(我每天收到150个PDF文件,第一页是我需要的发票,后面3到12页是我不需要的备份)所以输入是150个不同大小的PDF文件,我想要的输出是1 个 PDF 文件,仅包含 150 个文件中每个文件的第一页。

我似乎所做的是合并所有页面,除了第一页(这是我唯一需要的)。