“pdfrw”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

367 浏览

python - Python - 如何使用 pdfrw 正确填充 PDF 表单中的多行文本字段？

我正在使用带有 pdfrw 的 python 填写 PDF 表单。我对表单中的任何单行文本字段都没有问题。但是，当我尝试填充多行文本字段时，它无法正确呈现，它会忽略断线。

这是我的代码的一部分：

这是输出。

这是使用 Adobe Acrobat 在表单域中的设置。

我选择了以下选项：多行、滚动长文本、允许富文本格式。

我也尝试过使用\r和<br>标签。

我应该如何设置正确渲染的值？

2021-06-24T16:43:53.857

0 投票

0 回答

73 浏览

python - 如何使用 Python 在 PDF 文档的特定字段中添加签名？

我尝试在特定位置的特定字段中将图像添加到 PDF 中，我还参考了社区中的另一篇文章（如何在 Python 中将图像添加到 PDF 文件？），此代码允许我们将整个图像覆盖在 PDF 上，但我们想将图像插入 PDF 的特定位置。

在此先感谢您的线索。

python pdf pypdf2 pypdf pdfrw

2021-08-13T13:37:19.763

0 投票

1 回答

283 浏览

python - 将 Python pdfrw PdfReader 对象写入字节/文件流数组

我目前正在为 pdf 编辑器应用程序进行简单的概念验证。该示例应该是一个简化的 Python 脚本，展示了我们如何使用 pdfrw 库来编辑包含表单的 PDF 文件。

所以，这就是问题所在。我对将编辑后的 PDF 写入文件不感兴趣。 这个想法是文件打开和关闭很可能由外部代码处理，所以我希望我的文件中的所有编辑都在内存中完成。我不想将编辑后的文件流写入本地文件。

让我具体说明一下我的意思。我目前有一段这样的代码：

因此，如您所见，FormFiller 构造函数接收一个字节数组。事实上，它是一个io.BytesIO对象。该template_pdf变量使用PdfReader来自 pdfrw 库的对象。现在，当我们到达#<this point is crucial>标记时，我有一个filled_pdf变量，它是一个 PdfReader 对象。我想将它转换为一个文件流（一个字节数组，或者一个 io.BytesIO 对象，如果你愿意的话），并以这种形式返回它。我不想将其写入文件。但是，pdfrw (pdfrw.PdfWriter) 提供的编写器类不允许这样的操作。它只提供一种write(<filename>)方法，将 PdfReader 对象保存到 pdf 输出文件中。

我应该如何处理这个？你推荐一个解决方法吗？或者也许我应该使用一个完全不同的库来完成这个？

请帮忙：-（

python python-3.x pdf pdf-form pdfrw

2021-08-30T13:59:58.117

0 投票

0 回答

30 浏览

python - 无法使用 Python 的 pdfrw 库获取可填充框的密钥

使用 pdfrw 处理 Python 脚本以提取可填写的 pdf 并自动填写。我有一个电子表格提供给我，我必须用不同的信息多次填写同一张表格。我使用的过程与许多人使用的基本相同，但我无法获得任何键的输出。我尝试了一个完全不编辑我的脚本的不同的 pdf，它吐出了所有的键。好像是pdf的问题。有人有想法么？我觉得第一个想法是确保 pdf 实际上是可填写的，我向你保证是的。我的脚本如下。有效的 pdf 是 1.7 版的 pdf，而无效的是 1.6 版。

python pdf pdfrw fillable

2021-08-30T18:36:00.420

0 投票

0 回答

112 浏览

python-3.x - 用 pdfrw 填充 PDF 不显示值

我希望能够用 Python 填写 PDF。PDF 正在使用 pdfrw 库创建。当我在创建它后尝试打开它时，没有显示表单字段。

如果我取消注释此行pdf.Root.AcroForm.update(pdfrw.PdfDict(NeedAppearances=pdfrw.PdfObject('true')))，我会收到错误

如果我尝试使用默认 PDF 来填写表格，它可以工作（但我没有添加页面）: : pdf = pdfrw.PdfReader(pdfSrc)

最后，我用文本编辑器打开了 PDF，如果我在其中搜索一个值，我会找到它！（生成的 PDF 似乎是 1.3，也许是原因？）

python-3.x pdf pdfrw

2021-10-08T14:09:15.143

0 投票

0 回答

101 浏览

python - PDFrw - 从特定表单获取 PDF 表单字段和值

感谢您阅读并可能提供帮助。

我阅读了 PDFrw PYthon 库并应用了几种解决方案来帮助我前进。不幸的是，我无法从所有页面中检索所有字段。

我想检索字段值以映射我的 data_dict，此数据是从 Excel 电子表格中获取的。以下代码输出即以下内容：

如您所见，它跳过了前两页，而肯定有表单字段！

我想阅读的 PDF 可以在这里找到。它来自荷兰政府，所以不用担心！https://download.belastingdienst.nl/belastingdienst/docs/verzoek_2021_lh_premie_volksverzeker_toepas_30_procent_regel_lh5981z11fol.pdf

在第 1 页上工作

在第 2 页上工作

工作在第 3 页

这里是实际代码：

python pdf pdfrw

2021-10-20T10:16:03.297

0 投票

0 回答

56 浏览

python - 如何在pdf中插入.svg图片

我正在尝试在pdf页面中插入.svg图片（矢量图像）。

问题是大多数解决方案都描述了插入 Pixmap 图像（如 .png），但这不是我需要的。

ValueError：像素图必须是像素图

其他解决方案是将 .svg 转换为 .pdf 并在我的页面中插入这个新的 pdf 时。要插入我正在尝试使用pdfrw

但在这种情况下，我不知道如何更改页面上图像的坐标。最可能的解决方案是更改.Mediabox属性中的某些内容，但返回NoneType对象

python pdf svg pdfrw

2021-10-20T10:23:57.137

0 投票

2 回答

66 浏览

python - 如何在不重叠内容的情况下合并两个 PDF 文件

使用另一个stackoverflow问题和答案，我能够找到部分解决我正在尝试做的代码合并PDF文件。

但是，此修改后的代码会导致两个 PDF 的内容相互重叠。我正在尝试堆叠它们或垂直连接结果：

例子：

PDF1 目录 -> “Hello World”
PDF2 目录 -> “我是比尔”

下面的代码导致以下重叠图像：

所需的结果如下所示：

使用的代码导致图像重叠：

提前致谢！

python python-3.x pdf pdfrw

2021-12-01T16:08:03.240

0 投票

1 回答

23 浏览

hyperlink - 如何使用 python pdfrw 库将 PDF 网络链接转换为文件打开操作

我正在使用 pdfkit 将 html 转换为 pdf，效果很好，但 pdf 中的外部链接是网络链接。

我们使用的 pdf 查看器无法识别 pdf 网络链接，但文件打开操作确实有效。

我一直在尝试使用 pdfrw 库将 pdf 链接注释从 Web 链接更改为文件打开操作。

我尝试使用以下代码编辑 pdf 注释，但它不起作用。

该链接显示在新的 pdf 中，但没有与之关联的操作或目标文件。

hyperlink annotations pdf-generation pdfkit pdfrw

2022-01-03T16:53:38.907

0 投票

0 回答

15 浏览

python - 从 pdfrw 读取的 pdf 背景返回 Nonetype

使用pdfrw我正在尝试合并两个 pdf 以将背景（保存为 pdf 的枕头图像）添加到由 reportlab生成的现有 pdf 中。控制哪个背景出现在哪个页面上似乎更容易。我一直在关注 pdfrw 提供的名为fancy-watermark的示例，并对其进行了如下调整，以包括在合并之前对背景进行重新缩放：

但是，该方法在背景 pdf 上scale返回 a ：TypeError

TypeError：“NoneType”对象不可调用

python python-imaging-library reportlab pdfrw

2022-01-16T18:27:43.250

问题标签 [pdfrw]

Reference