问题标签 [pypdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 pyPdf 拆分页面,页面大小错误
我pyPdf
用来分割pdf页面。一切正常,但页面大小不一样。
原始页面大小:1000px
我用命令检查了页面大小:(w, h) = p.mediaBox.upperRight
. 为什么upperLeft
错了?
python - 在 Python 中调整 pdf 页面的大小
我正在使用 python 来裁剪 pdf 页面。一切正常,但是如何更改页面大小(宽度)?
这是我的作物代码:
当我裁剪页面时,我也需要调整它们的大小,我该怎么做?
python - 将 pdf 文件与 pypdf 合并
我正在编写一个脚本,用于解析 Internet 站点 (maya.tase.co.il) 中的链接、下载 pdf 文件并合并它们。它主要工作,但合并会给我不同类型的错误,具体取决于文件。我似乎无法弄清楚为什么。我剪掉了相关代码,只为两个导致问题的特定文件构建了一个测试。该脚本使用 pypdf,但我愿意尝试任何可行的方法。有些文件是加密的,有些不是。
我感谢任何花时间阅读本文的人。铝。
python - 关闭 python pypdf 的问题 - 写作。获取 valueError: 对已关闭文件的 I/O 操作
无法弄清楚这个函数(用于将互联网站点抓取为 pdf 的类的一部分)应该合并使用 pypdf 从网页生成的 pdf 文件。
这是方法代码:
我不断收到此错误:
但是当我检查 self._pdfstream 的状态时,我得到:
我究竟做错了什么?
我会很高兴得到任何帮助
python - 如何按特定单词将pdf文件拆分为多个pdf文件?
我有一个pdf文件。我想通过该文件中的某个特定单词将该文件拆分为多个 pdf 文件。我怎么能在 python 中做到这一点?
python - 运行 python 脚本的问题(pypdf/hex 错误)
我正在尝试使用 PyPDF 模块创建一个 Python 脚本。脚本在“根”文件夹中做什么,合并其中的所有 PDF,并将合并的 PDF 输出到“输出”文件夹中,并将其重命名为“Root.pdf”(包含拆分 PDF 的文件夹)。然后它对子目录执行相同的操作,为最终输出提供与子目录相同的名称。
我在处理子目录时卡住了,给了我一个与某些十六进制值相关的错误代码。(似乎它得到了一个不是十六进制的空值)
这是生成的错误代码:
这是脚本的源代码:
python - PyPDF 的 PdfFileReader() 在读取文件时遇到问题,文件不可调用
所以这是我的导入:
这是我写我的pdf:
(伟大的命名约定,我知道!)
我给它写了一些东西。
我在这里关闭它:
这是我尝试阅读的地方:
这是错误:
我不明白该错误,因为我知道该文件存在,并且当我注释掉这一行以及 input1 的后续行时,程序运行正常。
python - 为什么我的代码没有正确拆分扫描的 pdf 中的每一页?
更新:感谢 stardt 的脚本有效!pdf是另一个页面的页面。我在另一个上尝试了脚本,它也正确地吐出了每个pdf页面,但是页码的顺序有时是对的,有时是错误的。比如pdf文件的第25-28页,打印的页码是14、15、17、16。我想知道为什么?整个pdf可以从http://download304.mediafire.com/u6ewhjt77lzg/bgf8uzvxatckycn/3.pdf下载
原件:我有一个扫描的 pdf,其中两个纸页并排放置在一个 pdf 页面中。我想将 pdf 页面分成两部分,原来的左半部分成为两个新 pdf 页面中较早的部分。pdf 看起来像.
这是受Gillesun2up
启发命名的 Python 脚本:
我在终端中的 pdf 上尝试了该脚本,命令为un2up < page.pdf > out.pdf
,但输出out.pdf
未正确拆分。
我还检查了变量的值w
和h
的输出p.mediaBox.upperRight
,根据它们的实际比例,它们是514
和1224
不正确的。
该文件可以从http://download851.mediafire.com/bdr4sv7v5nzg/raci13ct5w4c86j/page.pdf下载。
attributes - NameError:将属性作为参数传递给方法时未定义名称“self”
我在一个使用 pyPdf 编辑 Pdfs 的小程序上遇到了一些问题。我试图将 pdf 的最后一页(self.lastpage)作为默认参数传递给类方法(pageoutput)当我这样做时,我收到以下错误:
如果我只是指定一个数字作为 end_page 它可以工作,但如果我使用属性它会失败。这个错误对我来说是一个神秘的赌注。pypdf 似乎没有问题,因为我可以毫无问题地打印 pdf 的最后一页。对于正在发生的事情,我将不胜感激!
这是我的代码(如果重要的话,我使用的是 pypdf 的 3.x 兼容版本):
django - pyPDF通过django合并并显示为httpresponse
我在合并 pyPDF 逻辑以将两个 pdf 文件合并到我的 django 站点时遇到问题。我编写了在本地服务器上的 python 文件中运行时合并文件的代码(但我需要明确标识要合并的文件:
此代码(来自我的 django 站点)用于显示单个 PDF。However, when more than one PDF is selected, only the final PDF selected displays, hence the need to integrate pyPDF to create one file containing all requested files.
我正在努力寻找一种将这两种方法结合起来的方法。我尝试过的是以下内容,但出现 IO 错误 [Errno 2] 没有这样的文件或目录:'obj.form'。所以它没有在 obj.form 中读取 - 我需要找到一种方法让它正确读取这些对象。无论如何,这是我尝试过的。
一如既往,感谢您提供的任何帮助或提示!