问题标签 [pypdf2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
6668 浏览

python - 如何使用 PyPDF2 获取 Pdf 方向

我正在使用 Python/Django。
PyPDF2 来阅读我当前的 pdf。

我想阅读我保存的 pdf 并获取 pdf 中单个页面的方向。

我希望能够确定页面是横向还是纵向。

最后一行设置 pagesize=letter 我想根据我当前的 pdf 确定的内容。
这是我的进口:

我试过 pyPdf .mediaBox 但它总是返回与预期文件大小相同的值,而不是实际大小。pyPdf 已经过时了。如您所见,我也尝试过 getWidth 和 withRotation。
我认为 PyPDF2 PdfFileReader 有一种简单的方法来确定所选对象的方向。

任何帮助表示赞赏。谢谢。

0 投票
1 回答
7872 浏览

python - 使用 PyPDF2 去除 PDF 上的水印

本节从 PyPDF2 库中导入必要的类

被告知根据我的 PDF 文件调整这部分

将修改后的内容设置为页面上的内容对象

将页面添加到输出

写流 outputStream = open("output.pdf", "wb") output.write(outputStream)

0 投票
1 回答
757 浏览

python - PyPDF 模块不能生成有效的 pdf 文件

我正在尝试在 python 中制作一些程序来操作我的 pdf beamer 演示文稿。教授使用点击动态转换,所以一页有几个点击转换。我想打印这些演示文稿,但我有大约 5000 页。所以我只想使用最后一次点击转换页面,所以我会将页面数量减少到 500 左右。我正在使用 PyPDF2 模块,但它不能生成有效的 pdf 文件。这是代码:

0 投票
1 回答
184 浏览

python - 找到 pypdfocr config.yaml 文件

在哪里可以找到 pypdfocr 的 config.yaml 文件?

pypdfocr release info中,它提到了一个配置文件,我可以使用它来指定 OCR 文件的归档位置。

例如:pypdfocr filename.pdf -f -c config.yaml这里的 config.yaml 文件是这样的:

问题是,我不知道这个文件在哪里,所以我可以根据自己的情况进行自定义。有任何想法吗?在 Mac 10.10 上。

0 投票
1 回答
2152 浏览

python - 正确安装pyPDF2时导入错误

我在 Ubuntu 14.04 LTS 上使用 python 2.7.6。当我运行这个命令时:

显示以下消息:

这意味着 pypdf2 已经安装在我的系统上,但是当我尝试导入 pyPDF2 时,出现以下消息:

0 投票
1 回答
3413 浏览

python-3.x - PyPDF2不打印文本的任何输出

我正在尝试使用 PyPDF2 从 pdf 打印文本。这是我的代码:

结果我得到了一些警告的空行。

我已经检查过这个警告本身不会影响结果,但就我而言,我什么也没得到。有什么建议么。谢谢

0 投票
2 回答
3894 浏览

python - Python 3 从网络解析 PDF

我试图从网页获取 PDF,对其进行解析并使用PyPDF2将结果打印到屏幕上。我使用以下代码使其正常工作:

编写一个文件以便我可以阅读它,虽然听起来很浪费,所以我想我只是用这个切断中间人:

然而,这给我一个AttributeError: 'bytes' object has no attribute 'seek'. 如何将 PDFrequests直接来自 PyPDF2?

0 投票
1 回答
299 浏览

python - 查找文本是否突出显示

我目前正在尝试使用PyPDF2阅读Python.我想知道PDF文件的文本是否突出显示。

语境:

我们使用不同颜色突出显示 PDF 文件中的文本。有没有办法知道使用任何库在Python中突出显示哪些文本?如果有请指导我到正确的来源。

我为这个问题寻找了很多地方。我发现PyPDF2无法解决这个问题?

0 投票
0 回答
180 浏览

python - Python ReportLab 库能够更改 PDF DA 字符串吗?

我能够使用reportlabs textAnnotation 函数,但是我无法修改文本注释的默认外观字符串。我看过源代码,

https://bitbucket.org/rptlab/reportlab/src/d3a68f4690c23e1726b997acd62011358ef1a636/src/reportlab/pdfbase/pdfdoc.py?at=default&fileviewer=file-view-default

我看到对于 freeTextAnnotation 函数,有一个选项可以更新默认外观字符串。不过,我无法让它发挥作用。我尝试在源代码中的 textAnnotation 函数中添加相同的“DA”字典选项,但是当我去声明字符串时它不起作用。

同样根据 Adob​​e 的 PDF 1.7 参考,DA 字符串是文本注释的必需字符串。如果不声明此字符串,则由 pdf 阅读器负责声明该字符串,这有时会导致阅读错误。

目前我所拥有的就是这个并且它正在工作,但是当我需要它是红色时,注释会以黑色出现。

要简单地问这个问题,我如何在reportlab中更改文本注释的外观颜色?setFillColorRGB 和 setStrokeColorRGB 都不会影响 reportlab 中注释的颜色。

另外,我还没有找到答案的另一个问题是,是否可以使用 reportlab 或 pypdf2 在 pdf 中创建图层?从我目前所阅读的内容来看,此功能似乎不可用,但如果有人能够成功地做到这一点,请告诉我。

谢谢。

0 投票
3 回答
5114 浏览

python - 如何在 PyCharm 中安装 PyPdf2(Windows-64 位)

我想在 PyCharm for Windows(64 位)中安装PyPdf2我试图去 Settings\Project\Project Interpreter,然后按“+”号,但没有找到 PyPdf2。

  • 我已经通过转到 PyPdf2 的提取路径将它安装到普通的 python2.7 然后我运行(python.exe setup.py install

  • 我试图通过“ conda install -c mbonix pypdf2=1.24”将它安装到anaconda,但出现错误“ Error Could not find URL: https://pythonhosted.org/PPdf2/Win-64/

  • 我试图通过“ conda install -c anaconda-nb-extensions pypdf2=1.24”将它安装到anaconda,但出现错误“ Error Could not find URL: https://pythonhosted.org/pypi/PPdf2/Win-64/
  • 我将存储库“ https://pythonhosted.org/PyPDF2/ ”添加到 PyCharm,但它也没有显示 PyPdf2!

我该怎么做才能将此类模块安装到 PyCharm

注意:我使用的是 PyCharm 社区版的最新版本 2016.2.2