问题标签 [qpdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
106 浏览

optimization - PDF 优化 - 在嵌入文本之前加载图像 - 请参阅提供的示例

我一直在尝试找到一种方法来让我们的 OCRed PDF (bad-uc.pdf) 表现得与保存的中缀 (good-uc.pdf) 相同。

如果您在 Acrobat Reader 中打开以下两个文件(任何版本都应该显示相同的问题),您会看到 bad-uc.pdf 在页面图像之前加载文本(非常缓慢)...其中 good-uc.pdf将所有内容加载在一起(似乎更快且响应更快)。

good-uc.pdf: https://drive.google.com/file/d/0B-Nxr9ySWJnNX2dZSmVscEZIRmc/view?usp=sharing bad-uc-pdf: https://drive.google.com/file/d/0B -Nxr9ySWJnNN2t6X2hFNTBxa0U/view?usp=sharing

我已经尝试过:pdftk、pdftops、ghostscript、pdf2ps、ps2pdf 和 qpdf,但仍然无法在文本之前加载图像...... PDF 专家能否解释一下为什么这两个 PDF 的行为不同......

我的猜测是中缀重组 PDF,以便在嵌入文本之前加载图像,但我找不到可以进行这种 PDF 结构优化的 Linux 命令行工具。

非常感激!!杰弗里

0 投票
2 回答
1972 浏览

c++ - 如果编码和ToUnicode都存在于pdf中,如何提取pdf中的文本?如何映射它?

在这里,我使用 qpdf 工具解压缩数据,下面是输出。如果您看到编码和 ToUnicode 都存在于 pdf 中。我知道是否只有 ToUnicode 存在,所以如何使用 Cmap 文件映射单个字符。但是如果您看到内容流的输出如下

Tf 0.999402 0 0 1 71.9995 759.561 Tm [()-2.11826()-1.14177()2.67786()-2.11826()8.55269()-5.44998()-4.70186()2.67786()-2.32338()-2.32338()-2.32338()2.786() -3.75591()9.73429()]TJ

在 break-at 中有一些不可见的垃圾数据。那么如何将数据链接到cmap文件?

另一个问题是 /Encoding 中包含的值是什么?

10 0 obj << /BaseEncoding /WinAnsiEncoding /Differences [ 1 /g100 /g28 /g94 /g3 /g87 /g24 /g38 /g47 /g62 ] /Type /Encoding >>

即使我将差异数组的值一一传递到 FreeType 函数之一,也被命名为 FT_Get_Name_Indek。此函数返回值如 [ 100 28 94 3 87 24 38 47 62]

这些价值观是什么?如何映射那些价值?

这是pdf

按照cmd运行

qpdf --stream-data=解压缩 input.pdf output.text

输出文本

如果我将内容流数据传递到 zlib 中,我得到的输出相同。请从链接检查 output.txt 文件

0 投票
2 回答
4780 浏览

python - 是否可以通过 Python 脚本执行 QPDF

我正在处理一个处理 PDF 文件的 python 脚本,尽管其中一些包含限制使用仅打印的加密,我必须在处理它们之前手动删除它。

为此,在运行脚本之前,我一直在手动使用QPDF来消除对单个 PDF 文件的这些限制(qpdf 的命令非常简单......在命令提示符内 -> qpdf --decrypt input.pdf output.pdf)

我的问题是 - 不是手动执行此操作,是否可以在我的 Python 脚本中执行 QPDF 可执行文件并运行命令?我还没有找到任何专门用于控制 QPDF 的 python 模块,所以我不抱太大希望。

0 投票
3 回答
12040 浏览

r - 如何在 Windows 上构建 qpdf?

在对我的 R 包(通过devtools::check())运行检查时,我会遇到警告''qpdf' is needed for checks on size reduction of PDFs。我发现这个问题是否被建议(如果我正确理解答案)运行Sys.which(Sys.getenv("R_QPDF", "qpdf"))并查看是否找到 qpdf。就我而言,这只是返回

qpdf ""

所以,我想我没有正确安装 qpdf。不幸的是,在 Windows 上安装 qpdf 似乎相当复杂。我的第一个问题是:为 Windows 安装 qpdf 真的如此痛苦和复杂,还是有一个简单的解决方案?

我已经按照说明进行操作,直到据说将 C:\MinGW-w64\bin 和 C:\MinGW-w64\lib\mingw 添加到 PATH 变量中。但是后来我没有找到安装qpdf 的更多具体说明,只有关于如何使用不同的其他程序构建qpdf。第二个问题是:我的假设是否正确,即在我构建qpdf 之后它已安装?但真正的问题是:构建 qpdf 的最佳方式是什么?我在我的 C:\MinGW\msys\1.0\bin\bash.exe 中尝试了“使用 MinGW 构建”部分中的./config-mingw32和命令,但收到错误消息并且不知道如何解决此问题。./config-mingw64./config-mingw32: No such file or directory


我正在使用 Windows 10,R 版本 3.3.2 Patched (2017-01-07 r71934)——“Sincere Pumpkin Patch”和 RStudio 1.0.136。

0 投票
1 回答
1679 浏览

encryption - Qpdf在没有密码的情况下无法加密

我正在尝试对 pdf 文件添加限制,但不需要用户密码。由于某种原因,我无法做到这一点。

帮助指出:

用户密码和所有者密码中的一个或两个可以是空字符串。

我应该如何指定空密码字符串?

0 投票
1 回答
1710 浏览

pdf - PDF 支持哪些不同的密码保护选项?

pdftk我可以看到三个选项:

当我打开protected-ownerpw.pdf并且protected-input.pdf不要求我输入密码时。只protected-userpw.pdf给出预期的结果。做什么ownerpwinput_pw做什么?

我用来qpdf从受保护的文件中创建不受保护的文件。现在我想知道这是否总是有效。PDF 格式支持哪些密码保护机制?什么qpdf支持。

0 投票
1 回答
887 浏览

c# - 如何在 asp.net 应用程序中使用 qpdf 设置线性化 PDF(网络快速查看属性)

QPDF 可以将 pdf 转换为线性化 pdf(网络快速查看属性)。我可以使用命令行: qpdf --linearize input.pdf output.pdf 将 pdf 转换为线性化 pdf。

我如何在 asp.net 程序上使用它?

我的代码是这样的

有没有其他解决方案可以在 asp.net 中使用 Qpdf?非常感谢!

0 投票
2 回答
1285 浏览

c# - 在 C# 中使用 QPDF

我正在尝试翻译这个 qpdf 命令:

qpdf --qdf --object-streams=disable input.pdf editable.pdf

进入使用 qpdf dll 时我需要的等效方法调用(可从此处获得:https ://sourceforge.net/projects/qpdf/ )。

我通过 dumpbin 运行 qpdf dll 以获取函数名称,并通过查看包含用于 c++ 项目的头文件,我可以看到函数的参数。

例如,上面传递 --object-streams 选项所需的函数将(据我所知)是这个函数:

从 c++ 头文件变为:

在 C# 文件中。

问题是当我使用上述功能时,我得到一个

AccessViolationException:试图读取或写入受保护的内存

错误,这让我觉得我需要以某种方式创建一个 QPDF 对象,但我从未使用过面向对象的 pinvokes,所以我不知道如何使该对象在 c# 中可访问。

如果有人已经熟悉在 C# 甚至 C++ 中使用 dll,并且可以告诉我调用正确的函数来复制命令,我将不胜感激!

0 投票
1 回答
686 浏览

pdf - 连接 PDF 时构建 TOC

我有十几篇 PDF 论文,我想将它们组合成一个带有目录的串联主 PDF,其中每个条目都是指向每篇论文第一页的可点击链接。TOC 可以是带有内部链接的页面,也可以是适当的 PDF TOC。

最好的是 Linux 和 macOS 上的命令行解决方案。到目前为止,我使用了 QPDF,它非常适合连接文章 PDF,但它没有构建 TOC。

这是一个一次性的问题,所以我很乐意编写一些(bash、Python 或其他)脚本代码来生成这个 TOC。对于实用程序来说,链接是可点击的很重要。

知道怎么做吗?

0 投票
3 回答
555 浏览

ubuntu - 从使用 qpdf 中删除密码失败

这失败并显示以下消息

密码正确且存在a.pdf。网上所有的例子都有相同的格式。

我在 ubuntu 18.04 上运行相同。pdftk 在 ubuntu 18 中不再可用。