问题标签 [pdfrw]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
367 浏览

python - Python - 如何使用 pdfrw 正确填充 PDF 表单中的多行文本字段?

我正在使用带有 pdfrw 的 python 填写 PDF 表单。我对表单中的任何单行文本字段都没有问题。但是,当我尝试填充多行文本字段时,它无法正确呈现,它会忽略断线。

这是我的代码的一部分:

这是输出。

在此处输入图像描述

这是使用 Adob​​e Acrobat 在表单域中的设置。

在此处输入图像描述

我选择了以下选项:多行、滚动长文本、允许富文本格式。

我也尝试过使用\r<br>标签。

我应该如何设置正确渲染的值?

0 投票
0 回答
73 浏览

python - 如何使用 Python 在 PDF 文档的特定字段中添加签名?

我尝试在特定位置的特定字段中将图像添加到 PDF 中,我还参考了社区中的另一篇文章(如何在 Python 中将图像添加到 PDF 文件?),此代码允许我们将整个图像覆盖在 PDF 上,但我们想将图像插入 PDF 的特定位置。

在此先感谢您的线索。

0 投票
1 回答
283 浏览

python - 将 Python pdfrw PdfReader 对象写入字节/文件流数组

我目前正在为 pdf 编辑器应用程序进行简单的概念验证。该示例应该是一个简化的 Python 脚本,展示了我们如何使用 pdfrw 库来编辑包含表单的 PDF 文件。

所以,这就是问题所在。我对将编辑后的 ​​PDF 写入文件不感兴趣。 这个想法是文件打开和关闭很可能由外部代码处理,所以我希望我的文件中的所有编辑都在内存中完成。我不想将编辑后的文件流写入本地文件。

让我具体说明一下我的意思。我目前有一段这样的代码:

因此,如您所见,FormFiller 构造函数接收一个字节数组。事实上,它是一个io.BytesIO对象。该template_pdf变量使用PdfReader来自 pdfrw 库的对象。现在,当我们到达#<this point is crucial>标记时,我有一个filled_pdf变量,它是一个 PdfReader 对象。我想将它转换为一个文件流(一个字节数组,或者一个 io.BytesIO 对象,如果你愿意的话),并以这种形式返回它。我不想将其写入文件。但是,pdfrw (pdfrw.PdfWriter) 提供的编写器类不允许这样的操作。它只提供一种write(<filename>)方法,将 PdfReader 对象保存到 pdf 输出文件中。

我应该如何处理这个?你推荐一个解决方法吗?或者也许我应该使用一个完全不同的库来完成这个?

请帮忙 :-(

0 投票
0 回答
30 浏览

python - 无法使用 Python 的 pdfrw 库获取可填充框的密钥

使用 pdfrw 处理 Python 脚本以提取可填写的 pdf 并自动填写。我有一个电子表格提供给我,我必须用不同的信息多次填写同一张表格。我使用的过程与许多人使用的基本相同,但我无法获得任何键的输出。我尝试了一个完全不编辑我的脚本的不同的 pdf,它吐出了所有的键。好像是pdf的问题。有人有想法么?我觉得第一个想法是确保 pdf 实际上是可填写的,我向你保证是的。我的脚本如下。有效的 pdf 是 1.7 版的 pdf,而无效的是 1.6 版。

0 投票
0 回答
112 浏览

python-3.x - 用 pdfrw 填充 PDF 不显示值

我希望能够用 Python 填写 PDF。PDF 正在使用 pdfrw 库创建。当我在创建它后尝试打开它时,没有显示表单字段。

如果我取消注释此行pdf.Root.AcroForm.update(pdfrw.PdfDict(NeedAppearances=pdfrw.PdfObject('true'))),我会收到错误

如果我尝试使用默认 PDF 来填写表格,它可以工作(但我没有添加页面): : pdf = pdfrw.PdfReader(pdfSrc)

最后,我用文本编辑器打开了 PDF,如果我在其中搜索一个值,我会找到它!(生成的 PDF 似乎是 1.3,也许是原因?)

0 投票
0 回答
101 浏览

python - PDFrw - 从特定表单获取 PDF 表单字段和值

感谢您阅读并可能提供帮助。

我阅读了 PDFrw PYthon 库并应用了几种解决方案来帮助我前进。不幸的是,我无法从所有页面中检索所有字段。

我想检索字段值以映射我的 data_dict,此数据是从 Excel 电子表格中获取的。以下代码输出即以下内容:

如您所见,它跳过了前两页,而肯定有表单字段!

我想阅读的 PDF 可以在这里找到。它来自荷兰政府,所以不用担心!https://download.belastingdienst.nl/belastingdienst/docs/verzoek_2021_lh_premie_volksverzeker_toepas_30_procent_regel_lh5981z11fol.pdf

在第 1 页上工作

在第 2 页上工作

工作在第 3 页

这里是实际代码:

0 投票
0 回答
56 浏览

python - 如何在pdf中插入.svg图片

我正在尝试在pdf页面中插入.svg图片(矢量图像) 。

问题是大多数解决方案都描述了插入 Pixmap 图像(如 .png),但这不是我需要的。

ValueError:像素图必须是像素图

其他解决方案是将 .svg 转换为 .pdf 并在我的页面中插入这个新的 pdf 时。要插入我正在尝试使用pdfrw

但在这种情况下,我不知道如何更改页面上图像的坐标。最可能的解决方案是更改.Mediabox属性中的某些内容,但返回NoneType对象

0 投票
2 回答
66 浏览

python - 如何在不重叠内容的情况下合并两个 PDF 文件

使用另一个stackoverflow问题和答案,我能够找到部分解决我正在尝试做的代码合并PDF文件

但是,此修改后的代码会导致两个 PDF 的内容相互重叠。我正在尝试堆叠它们或垂直连接结果:

例子:

  • PDF1 目录 -> “Hello World”
  • PDF2 目录 -> “我是比尔”

下面的代码导致以下重叠图像:

  • 结果无效

所需的结果如下所示:

  • 期望的结果

使用的代码导致图像重叠:

提前致谢!

0 投票
1 回答
23 浏览

hyperlink - 如何使用 python pdfrw 库将 PDF 网络链接转换为文件打开操作

我正在使用 pdfkit 将 html 转换为 pdf,效果很好,但 pdf 中的外部链接是网络链接。

我们使用的 pdf 查看器无法识别 pdf 网络链接,但文件打开操作确实有效。

我一直在尝试使用 pdfrw 库将 pdf 链接注释从 Web 链接更改为文件打开操作。

我尝试使用以下代码编辑 pdf 注释,但它不起作用。

该链接显示在新的 pdf 中,但没有与之关联的操作或目标文件。

0 投票
0 回答
15 浏览

python - 从 pdfrw 读取的 pdf 背景返回 Nonetype

使用pdfrw我正在尝试合并两个 pdf 以将背景(保存为 pdf 的枕头图像)添加到由reportlab生成的现有 pdf 中。控制哪个背景出现在哪个页面上似乎更容易。我一直在关注 pdfrw 提供的名为fancy-watermark的示例,并对其进行了如下调整,以包括在合并之前对背景进行重新缩放:

但是,该方法在背景 pdf 上scale返回 a :TypeError

TypeError:“NoneType”对象不可调用