1

嗨,我在将 pdfrw 用于 python 时遇到问题。我正在尝试用 pdfrw 填充 PDF,我可以填充一页。obj.pages 只接受整数而不接受切片。目前它只会填满指定的一页。当我在 obj.page 中输入第二页时,它只填充第二页,依此类推。我需要填充四页。

import pdfrw

TEMPLATE_PATH = 'temppath.pdf'
OUTPUT_PATH = 'outpath.pdf'

ANNOT_KEY = '/Annots'
ANNOT_FIELD_KEY = '/T'
ANNOT_VAL_KEY = '/V'
ANNOT_RECT_KEY = '/Rect'
SUBTYPE_KEY = '/Subtype'
WIDGET_SUBTYPE_KEY = '/Widget'

def write_fillable_pdf(input_pdf_path, output_pdf_path, data_dict):
    template_pdf = pdfrw.PdfReader(input_pdf_path)
    annotations = template_pdf.pages[:3][ANNOT_KEY]
    for annotation in annotations:
        if annotation[SUBTYPE_KEY] == WIDGET_SUBTYPE_KEY:
            if annotation[ANNOT_FIELD_KEY]:
                key = annotation[ANNOT_FIELD_KEY][1:-1]
                if key in data_dict.keys():
                    annotation.update(
                        pdfrw.PdfDict(V='{}'.format(data_dict[key]))
                    )
    pdfrw.PdfWriter().write(output_pdf_path, template_pdf)

data_dict = {}

if __name__ == '__main__':
write_fillable_pdf(TEMPLATE_PATH, OUTPUT_PATH, data_dict)

当我使用切片时

annotations = template_pdf.pages[:3][ANNOT_KEY]

返回错误

TypeError: list indices must be integers or slices, not str

否则它只会在一页上运行

annotations = template_pdf.pages[0][ANNOT_KEY]

或者

annotations = template_pdf.pages[1][ANNOT_KEY]

将运行指示的页面

我遇到了类似的问题: 如何使用 Python、Reportlab 和 pdfrw 将文本添加到 pdf 的第二页?

从这篇文章开始工作 https://bostata.com/post/how_to_populate_fillable_pdfs_with_python/

4

1 回答 1

1

由于切片时出现问题,您看到的表达式的异常pages[:3][ANNOT_KEY]不会发生- 效果很好。但是列表的切片是一个列表,语法尝试使用字符串 ANNOT_KEY 对这个新列表进行索引。 pages[:3][ANNOT_KEY]

但不要相信我的话;分割线:

    annotations = template_pdf.pages[:3][ANNOT_KEY]

分为两行:

    foobar = template_pdf.pages[:3]
    annotations = foobar[ANNOT_KEY]

并查看错误发生在哪里。

无论如何,正如我在上面的评论中提到的,您也不应该使用字符串来索引 PdfDicts - 使用 PdfStrings,或者只是使用正确的属性访问它们。

我个人不使用注释,所以我不确定你想要完成什么,但如果注释总是一个列表,你可以这样做:

    annotations = []
    for page in template_pdf.pages[:3]:
        annotations.extend(page.Annots or [])

or []上面表达式的目的是处理页面没有 /Annots 的情况——因为 pdfrw 将返回None不存在的 dict 键(以匹配 PDF 词典的语义行为),您要确保您不是试图用None.)扩展列表

如果多个页面可以共享任何注释,您可能还想对列表进行重复数据删除。

免责声明:我是 pdfrw 的主要作者。

于 2019-03-06T02:52:14.237 回答