1

在 Python 中,我有 ReportLab 生成的文件。现在,我需要从该 PDF 中提取一些页面并隐藏机密信息。

我可以创建一个带有黑点的 PDF 文件并使用 pyPdf 来合并页面,但人们仍然可以选择并复制粘贴黑点下的信息。

有没有办法让这些地点完全保密?

例如,我需要在页面上隐藏地址,我该怎么做?

谢谢,

4

2 回答 2

1

基本上,您必须在 PDF 的页面内容流中删除相应的文本绘制命令。两次生成页面要容易得多,一次包含机密信息,一次不包含机密信息。

可能(我对 ReportLab 的了解不够)以一种更易于访问机密信息(例如,作为单独的 XObjects)以进行删除的方式专门制作 PDF。您仍然必须对 PDF 进行相当低级的操作——我不建议这样做。

于 2010-11-02T22:52:16.723 回答
0

(对不起,我发布问题时无法登录......)

不幸的是,无法随意重新生成文档(上下文相关),而那些 PDF 文件(大约 35 个)有 3000 多页。

我正在考虑使用 pdf2ps 和 pdf2ps 回来,但是质量很高。

pdf2ps -dLanguageLevel=3 input.pdf - | ps2pdf14 - 输出.pdf

如果我改用“pdftops”,文本仍然是可选的。如果有办法让它像“pdf2ps”一样不可选择,但质量更好,它也可以。

于 2010-11-02T23:30:20.390 回答