0

有 pdf (A),如果我们无法使用阅读器复制字符,以及 pdf (B),其字符是可复制的,但当粘贴到文本编辑器时,它变成了人类不可读的代码。(在这种情况下加密并不意味着受密码保护)。

  1. 如何以编程方式识别这些(A)和(B)类型的pdf,首选python?
  2. 是否可以从这些文件中正确提取文本?
4

0 回答 0