在 Python 中,我有 ReportLab 生成的文件。现在,我需要从该 PDF 中提取一些页面并隐藏机密信息。
我可以创建一个带有黑点的 PDF 文件并使用 pyPdf 来合并页面,但人们仍然可以选择并复制粘贴黑点下的信息。
有没有办法让这些地点完全保密?
例如,我需要在页面上隐藏地址,我该怎么做?
谢谢,
基本上,您必须在 PDF 的页面内容流中删除相应的文本绘制命令。两次生成页面要容易得多,一次包含机密信息,一次不包含机密信息。
可能(我对 ReportLab 的了解不够)以一种更易于访问机密信息(例如,作为单独的 XObjects)以进行删除的方式专门制作 PDF。您仍然必须对 PDF 进行相当低级的操作——我不建议这样做。
(对不起,我发布问题时无法登录......)
不幸的是,无法随意重新生成文档(上下文相关),而那些 PDF 文件(大约 35 个)有 3000 多页。
我正在考虑使用 pdf2ps 和 pdf2ps 回来,但是质量很高。
pdf2ps -dLanguageLevel=3 input.pdf - | ps2pdf14 - 输出.pdf
如果我改用“pdftops”,文本仍然是可选的。如果有办法让它像“pdf2ps”一样不可选择,但质量更好,它也可以。