问题标签 [pdfrw]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 Python 在 PDF 文档的特定字段中添加签名?
我尝试在特定位置的特定字段中将图像添加到 PDF 中,我还参考了社区中的另一篇文章(如何在 Python 中将图像添加到 PDF 文件?),此代码允许我们将整个图像覆盖在 PDF 上,但我们想将图像插入 PDF 的特定位置。
在此先感谢您的线索。
python - 将 Python pdfrw PdfReader 对象写入字节/文件流数组
我目前正在为 pdf 编辑器应用程序进行简单的概念验证。该示例应该是一个简化的 Python 脚本,展示了我们如何使用 pdfrw 库来编辑包含表单的 PDF 文件。
所以,这就是问题所在。我对将编辑后的 PDF 写入文件不感兴趣。 这个想法是文件打开和关闭很可能由外部代码处理,所以我希望我的文件中的所有编辑都在内存中完成。我不想将编辑后的文件流写入本地文件。
让我具体说明一下我的意思。我目前有一段这样的代码:
因此,如您所见,FormFiller 构造函数接收一个字节数组。事实上,它是一个io.BytesIO
对象。该template_pdf
变量使用PdfReader
来自 pdfrw 库的对象。现在,当我们到达#<this point is crucial>
标记时,我有一个filled_pdf
变量,它是一个 PdfReader 对象。我想将它转换为一个文件流(一个字节数组,或者一个 io.BytesIO 对象,如果你愿意的话),并以这种形式返回它。我不想将其写入文件。但是,pdfrw (pdfrw.PdfWriter) 提供的编写器类不允许这样的操作。它只提供一种write(<filename>)
方法,将 PdfReader 对象保存到 pdf 输出文件中。
我应该如何处理这个?你推荐一个解决方法吗?或者也许我应该使用一个完全不同的库来完成这个?
请帮忙 :-(
python - 无法使用 Python 的 pdfrw 库获取可填充框的密钥
使用 pdfrw 处理 Python 脚本以提取可填写的 pdf 并自动填写。我有一个电子表格提供给我,我必须用不同的信息多次填写同一张表格。我使用的过程与许多人使用的基本相同,但我无法获得任何键的输出。我尝试了一个完全不编辑我的脚本的不同的 pdf,它吐出了所有的键。好像是pdf的问题。有人有想法么?我觉得第一个想法是确保 pdf 实际上是可填写的,我向你保证是的。我的脚本如下。有效的 pdf 是 1.7 版的 pdf,而无效的是 1.6 版。
python-3.x - 用 pdfrw 填充 PDF 不显示值
我希望能够用 Python 填写 PDF。PDF 正在使用 pdfrw 库创建。当我在创建它后尝试打开它时,没有显示表单字段。
如果我取消注释此行pdf.Root.AcroForm.update(pdfrw.PdfDict(NeedAppearances=pdfrw.PdfObject('true')))
,我会收到错误
如果我尝试使用默认 PDF 来填写表格,它可以工作(但我没有添加页面): :
pdf = pdfrw.PdfReader(pdfSrc)
最后,我用文本编辑器打开了 PDF,如果我在其中搜索一个值,我会找到它!(生成的 PDF 似乎是 1.3,也许是原因?)
python - PDFrw - 从特定表单获取 PDF 表单字段和值
感谢您阅读并可能提供帮助。
我阅读了 PDFrw PYthon 库并应用了几种解决方案来帮助我前进。不幸的是,我无法从所有页面中检索所有字段。
我想检索字段值以映射我的 data_dict,此数据是从 Excel 电子表格中获取的。以下代码输出即以下内容:
如您所见,它跳过了前两页,而肯定有表单字段!
我想阅读的 PDF 可以在这里找到。它来自荷兰政府,所以不用担心!https://download.belastingdienst.nl/belastingdienst/docs/verzoek_2021_lh_premie_volksverzeker_toepas_30_procent_regel_lh5981z11fol.pdf
在第 1 页上工作
在第 2 页上工作
工作在第 3 页
这里是实际代码:
python - 如何在pdf中插入.svg图片
我正在尝试在pdf页面中插入.svg图片(矢量图像) 。
问题是大多数解决方案都描述了插入 Pixmap 图像(如 .png),但这不是我需要的。
ValueError:像素图必须是像素图
其他解决方案是将 .svg 转换为 .pdf 并在我的页面中插入这个新的 pdf 时。要插入我正在尝试使用pdfrw
但在这种情况下,我不知道如何更改页面上图像的坐标。最可能的解决方案是更改.Mediabox属性中的某些内容,但返回NoneType对象
python - 如何在不重叠内容的情况下合并两个 PDF 文件
使用另一个stackoverflow问题和答案,我能够找到部分解决我正在尝试做的代码合并PDF文件。
但是,此修改后的代码会导致两个 PDF 的内容相互重叠。我正在尝试堆叠它们或垂直连接结果:
例子:
- PDF1 目录 -> “Hello World”
- PDF2 目录 -> “我是比尔”
下面的代码导致以下重叠图像:
所需的结果如下所示:
使用的代码导致图像重叠:
提前致谢!
hyperlink - 如何使用 python pdfrw 库将 PDF 网络链接转换为文件打开操作
我正在使用 pdfkit 将 html 转换为 pdf,效果很好,但 pdf 中的外部链接是网络链接。
我们使用的 pdf 查看器无法识别 pdf 网络链接,但文件打开操作确实有效。
我一直在尝试使用 pdfrw 库将 pdf 链接注释从 Web 链接更改为文件打开操作。
我尝试使用以下代码编辑 pdf 注释,但它不起作用。
该链接显示在新的 pdf 中,但没有与之关联的操作或目标文件。
python - 从 pdfrw 读取的 pdf 背景返回 Nonetype
使用pdfrw我正在尝试合并两个 pdf 以将背景(保存为 pdf 的枕头图像)添加到由reportlab生成的现有 pdf 中。控制哪个背景出现在哪个页面上似乎更容易。我一直在关注 pdfrw 提供的名为fancy-watermark的示例,并对其进行了如下调整,以包括在合并之前对背景进行重新缩放:
但是,该方法在背景 pdf 上scale
返回 a :TypeError
TypeError:“NoneType”对象不可调用