我想在未压缩的 pdf 中编辑几行。我发现了一个类似的问题,但由于我需要扫描文件几次以获得我想要更改的确切行位置,这并不适合(并且 RegEx 匹配的纯数量超出了预期)。pdf 包含 utf-8 可编码行(其中一些我想编辑,特别是书签目标 ID)和很多 blob(猜测图像等)。当我用记事本编辑文件时,它工作正常,但是当我以编程方式(读入、更改几行、写回)时,图像和一些格式丢失了。(因为他们一开始没有被读入,忽略选项)
with codecs.open("merged-uncompressed.pdf", "r", encoding='ascii', errors='ignore') as f:
我可以读取文件errors="surrogateescape"
并想映射上面导入的行,但不知道这种方法是否可行。
有谁知道如何处理这个问题?
最好的,卢卡斯