问题标签 [qpdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
197 浏览

pdf - 用于解密 PDF 文件源代码的工具/命令?

我正在使用 qpdf 命令查看 PDF 文件的原始代码(源代码)。具体来说,我正在使用以下命令:

然而,很多 PDF 元数据在这个解压文件中被加密,并且有很多不可打印的 ASCII 字符。我对实际加密的 pdf 文件的一些数据感兴趣。假设我有 pdf 文件的密码(比如 pwd="passwd"),我怎样才能得到与 qpdf 命令的输出类似的输出,但数据已被解密?

编辑:

链接中附有示例文件。请检查第 1841 - 3258 行。具体来说,在整个文件中,我无法找到 TransformParams 字典,尽管我已经添加了权限。我相信它可能在这个加密文本中。

关联:

0 投票
1 回答
91 浏览

pdf - 如何引用预格式化 PDF (QDF) 中的文本内容?

使用文本编辑器编辑 PDF 文件的源代码时,我可以通过多次引用一个对象来多次使用它。

此示例是对对象 15 的引用:

如果对象 15 是文本,则该文本将出现在 PDF 查看器中它被引用的每个位置。但它总是在 /Resources 下和对象 15 内的流中定义的字体和大小:

我真正需要的是有一串字符(实际上是四位数字),它在 PDF 的源代码中的两个或多个位置被引用。但是,每次使用的字体和大小都不同,而两种字体的编码是相同的(也就是说,在转换为 QDF 格式后,使用的字符在文本编辑器中可以作为纯文本读取 - 只要它们在 ASCII 范围内范围)。

所以我想我正在寻找的是两件事:

  1. 将文本字符串添加到 PDF 文件的正确方法,以便我可以
  2. 从不同的中引用它。

--> 有没有办法做到这一点?

[要求是,一旦准备好,如果我在要修改的行上方添加注释,则可以在任何系统上将四个数字替换为四个不同的数字,以便他们可以轻松找到正确的位置。无需先安装软件或字体(已嵌入在预格式化的 PDF 中),只需使用文本编辑器即可。]

0 投票
1 回答
621 浏览

qpdf - 如何将 pdf 文件合并在一起并只从每个文件中获取第一页?

我正在使用 qpdf 合并目录中的所有 pdf 文件,并且我只想合并多个输入文件的第一页。根据页面选择的 qpdf 文档,这应该是可能的。我尝试了几种变体,但没有运气:

我能做些什么?

0 投票
0 回答
102 浏览

pdf - QPDF如何检测页面大小(或比例)

如何使用 qpdf 检测页面大小(高 x 宽)?

我知道这可能是尺寸是相对的,但至少我可以知道高度和宽度之间的比率(例如a3,a4)。

0 投票
0 回答
21 浏览

pdf - 在没有用户密码的情况下,Mac OS 10.15.7 上的 PDF 打印锁定被破坏

嘿伙计们,我使用这个命令使用最新的 qpdf 来加密和阻止打印

qpdf --encrypt "" ownerspass 128 --print=none -- input.pdf --replace-input

我的文件名是这种格式

generated-preview-2021-07-12T14-31-48.250Z.pdf

打印锁定在我测试的其他任何地方都有效,但在这个稍微旧版本的 MacOS 上无效,有什么想法吗?

0 投票
1 回答
104 浏览

pdf - pdf如何批量列出带有注释的pdf?qpdf? pdf信息?

当我打印一个我用 Okular 注释的 pdf 时,我感到很惊讶,尽管它确实显示在屏幕上,但它没有注释。我必须将带注释的文件保存为打印的 pdf,然后打印。

问题:如何列出至少一页上至少有一个注释的所有 pdf?

显然,当有注释时,pdfinfo 返回 Acroform

但不显示文件名。

我不熟悉 qpdf,但它似乎没有提供此信息

谢谢

0 投票
1 回答
152 浏览

linux - Bash脚本qpdf在1个目录中拆分多个pdf

我编写了一个简单的 bash 脚本,因为我需要定期将多个 pdf 拆分为 2 个 pdf。我需要每次都以相同的顺序拆分它们(第 1-5 页和第 6 页到最后一页)。我需要对新拆分的 pdf 进行唯一命名,以便将它们分开(即 inv-1.pdf rec-1.pdf;inv-2.pdf rec-2.pdf 等)。我的脚本仅在文件夹中有 5 个以上时才拆分 1 个 pdf。任何建议表示赞赏。

'''

0 投票
1 回答
38 浏览

bash - 如何反转pdf偶数页和奇数页?

我有大量的 PDF,我注意到其中一些的页面顺序错误:

正确顺序:1-2-3-4-5-6-7-8-9-10...120-121

错误顺序:1-2- 4-3-6-5-8-7-10-9...121-120

前两页还可以,但其他的完全搞砸了。

如您所见,如果我必须手动执行此操作,我将不得不一一颠倒页面的顺序。

网上搜索,发现qpdf和pdftk这两个不错的工具,可以帮我解决这个问题,但是我真的没有任何使用经验。

你们能帮我解决一个 qpdf/pdftk 命令/bash 脚本吗?(或者,当然,为什么不呢。请记住,带有图形界面的程序可能不适合这项工作,因为这个问题存在于 100 多个文件中,手动执行并不是一个亮点选项)。

0 投票
0 回答
22 浏览

pdf - 按页面拆分后如何优化我的 pdf 存储库?

我有大约 20 个大 pdf,我按页面拆分,以便于访问。当我使用 qpdf 按页面拆分它时,我观察到总大小膨胀了 10 倍,这意味着我在所有每页 pdf 中都有一些冗余数据。很可能是存储的字体导致膨胀。有没有办法将这些字体外部化(比如用户可以预先在他们的设备上安装这些字体)?我的目标是,一旦按页面拆分 pdf,总大小应在原始文件的 1x-2x 范围内,以便我可以将其托管在我的网站上。

这是来自存储库的示例 pdf

https://www.mea.gov.in/Images/CPV/Volume17_Part_III.pdf

欢迎任何有关 pdf 拆分的帮助

谢谢!

0 投票
0 回答
27 浏览

python-sphinx - 由 python-sphinx 创建的网页对某些用户来说是有问题的

编辑:为了阅读此页面的人的利益。这个问题是或部分是https://github.com/readthedocs/sphinx_rtd_theme/issues/880。这不是我报告的。2020 年 2 月报告。已接受错误,2022 年 2 月仍然开放。还有演示问题的代码和屏幕截图。

你能

  1. 看一下,可能以相反的顺序,在

    1. https://github.com/qpdf/qpdf/issues/663
    2. https://github.com/qpdf/qpdf/blob/main/build-scripts/build-doc
  2. 在https://github.com/qpdf/qpdf/issues/663或此处添加评论,或者以其他方式显示您为这篇文章投入了一些时间?

我只是一个qpdf用户。如果需要,可以制作屏幕截图。

谢谢你。

在下面回复Rob评论:我没有比上面的 663 问题更短的示例。我希望我有。这将简化事情。我没有缩小问题范围的技能。我可以从上面复制粘贴,相当长的663 问题。你是对的,我应该在这里写下,据我所知,只有在安装 html 文件和其他 2 个相关文件后才能重现问题。希望安装了 qpdf 文档的读者可以使用 file:///usr/share/doc/qpdf/singlehtml/index.html 。