问题标签 [pypdf2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 PyPDF2 获取 Pdf 方向
我正在使用 Python/Django。
PyPDF2 来阅读我当前的 pdf。
我想阅读我保存的 pdf 并获取 pdf 中单个页面的方向。
我希望能够确定页面是横向还是纵向。
最后一行设置 pagesize=letter 我想根据我当前的 pdf 确定的内容。
这是我的进口:
我试过 pyPdf .mediaBox 但它总是返回与预期文件大小相同的值,而不是实际大小。pyPdf 已经过时了。如您所见,我也尝试过 getWidth 和 withRotation。
我认为 PyPDF2 PdfFileReader 有一种简单的方法来确定所选对象的方向。
任何帮助表示赞赏。谢谢。
python - 使用 PyPDF2 去除 PDF 上的水印
本节从 PyPDF2 库中导入必要的类
被告知根据我的 PDF 文件调整这部分
将修改后的内容设置为页面上的内容对象
将页面添加到输出
写流 outputStream = open("output.pdf", "wb") output.write(outputStream)
python - PyPDF 模块不能生成有效的 pdf 文件
我正在尝试在 python 中制作一些程序来操作我的 pdf beamer 演示文稿。教授使用点击动态转换,所以一页有几个点击转换。我想打印这些演示文稿,但我有大约 5000 页。所以我只想使用最后一次点击转换页面,所以我会将页面数量减少到 500 左右。我正在使用 PyPDF2 模块,但它不能生成有效的 pdf 文件。这是代码:
python - 找到 pypdfocr config.yaml 文件
在哪里可以找到 pypdfocr 的 config.yaml 文件?
在pypdfocr release info中,它提到了一个配置文件,我可以使用它来指定 OCR 文件的归档位置。
例如:pypdfocr filename.pdf -f -c config.yaml
这里的 config.yaml 文件是这样的:
问题是,我不知道这个文件在哪里,所以我可以根据自己的情况进行自定义。有任何想法吗?在 Mac 10.10 上。
python - 正确安装pyPDF2时导入错误
我在 Ubuntu 14.04 LTS 上使用 python 2.7.6。当我运行这个命令时:
显示以下消息:
这意味着 pypdf2 已经安装在我的系统上,但是当我尝试导入 pyPDF2 时,出现以下消息:
python-3.x - PyPDF2不打印文本的任何输出
我正在尝试使用 PyPDF2 从 pdf 打印文本。这是我的代码:
结果我得到了一些警告的空行。
我已经检查过这个警告本身不会影响结果,但就我而言,我什么也没得到。有什么建议么。谢谢
python - Python 3 从网络解析 PDF
我试图从网页获取 PDF,对其进行解析并使用PyPDF2将结果打印到屏幕上。我使用以下代码使其正常工作:
编写一个文件以便我可以阅读它,虽然听起来很浪费,所以我想我只是用这个切断中间人:
然而,这给我一个AttributeError: 'bytes' object has no attribute 'seek'
. 如何将 PDFrequests
直接来自 PyPDF2?
python - 查找文本是否突出显示
我目前正在尝试使用PyPDF2
阅读Python
.我想知道PDF文件的文本是否突出显示。
语境:
我们使用不同颜色突出显示 PDF 文件中的文本。有没有办法知道使用任何库在Python中突出显示哪些文本?如果有请指导我到正确的来源。
我为这个问题寻找了很多地方。我发现PyPDF2
无法解决这个问题?
python - Python ReportLab 库能够更改 PDF DA 字符串吗?
我能够使用reportlabs textAnnotation 函数,但是我无法修改文本注释的默认外观字符串。我看过源代码,
我看到对于 freeTextAnnotation 函数,有一个选项可以更新默认外观字符串。不过,我无法让它发挥作用。我尝试在源代码中的 textAnnotation 函数中添加相同的“DA”字典选项,但是当我去声明字符串时它不起作用。
同样根据 Adobe 的 PDF 1.7 参考,DA 字符串是文本注释的必需字符串。如果不声明此字符串,则由 pdf 阅读器负责声明该字符串,这有时会导致阅读错误。
目前我所拥有的就是这个并且它正在工作,但是当我需要它是红色时,注释会以黑色出现。
要简单地问这个问题,我如何在reportlab中更改文本注释的外观颜色?setFillColorRGB 和 setStrokeColorRGB 都不会影响 reportlab 中注释的颜色。
另外,我还没有找到答案的另一个问题是,是否可以使用 reportlab 或 pypdf2 在 pdf 中创建图层?从我目前所阅读的内容来看,此功能似乎不可用,但如果有人能够成功地做到这一点,请告诉我。
谢谢。
python - 如何在 PyCharm 中安装 PyPdf2(Windows-64 位)
我想在 PyCharm for Windows(64 位)中安装PyPdf2我试图去 Settings\Project\Project Interpreter,然后按“+”号,但没有找到 PyPdf2。
我已经通过转到 PyPdf2 的提取路径将它安装到普通的 python2.7 然后我运行(
python.exe setup.py install
)我试图通过“
conda install -c mbonix pypdf2=1.24
”将它安装到anaconda,但出现错误“Error Could not find URL: https://pythonhosted.org/PPdf2/Win-64/
”- 我试图通过“
conda install -c anaconda-nb-extensions pypdf2=1.24
”将它安装到anaconda,但出现错误“Error Could not find URL: https://pythonhosted.org/pypi/PPdf2/Win-64/
” - 我将存储库“ https://pythonhosted.org/PyPDF2/ ”添加到 PyCharm,但它也没有显示 PyPdf2!
我该怎么做才能将此类模块安装到 PyCharm
注意:我使用的是 PyCharm 社区版的最新版本 2016.2.2