问题标签 [pdftk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
excel - 删除使用 pdfTk 创建的 pdf 中的多个嵌入字体
有没有办法从pdf文件中删除多次嵌入的字体?
这是我的场景:
1)一个程序生成几个单页pdf报告(查询数据库,将信息放在excel模板上并将格式化信息导出为pdf)
2) pdftk 将单页 pdf 合并到一个文件中。
一切正常,但生成的 pdf 的大小非常大:事实上,我注意到字体被嵌入了多次(与页数一样多次:所有页面都是从同一个 excel 模板开始生成的,字体嵌入在单个 pdf 文件中,而 pdftk 只是粘合 pdf)。有没有办法只保留每个嵌入字体的一个副本?
我尝试在从 excel->pdf 导出时仅在第一页中嵌入字体:文件的大小显着减小,但其他页面似乎无法访问嵌入的字体。
谢谢,亚历山德罗
ruby-on-rails - 来自pdftk unicode转换结果的ruby 1.8.7中的字符转换
我正在使用 pdftk 从 pdf 文件中解析标题,其中包含各种特定于语言的字符。
我需要在其中执行此操作的这个 ruby on rails 应用程序正在使用 ruby 1.8.7 和 rails 2.3.14,因此任何内置于 ruby 1.9 的编码解决方案现在都不是我的选择。
我需要做的例子:
如果标题包含 ü,当我使用 pdftk(命令行或使用 ruby pdf-toolkit gem)阅读 pdf 内容时,“ü”将转换为ü
在我的应用程序中,我真的希望在 ü 中使用它,因为这似乎可以很好地满足我在网页和 XML 文件中的需求。
我可以使用 ruby 显式转换字符
但显然我不想一一做这件事。
我尝试过使用 Iconv 来执行此操作,但我觉得我不知道要指定什么才能将其转换为渲染字符。我想也许这只是一个 utf-8 但它似乎并没有转换为渲染字符
我对在这里使用什么格式来获得渲染字符的最终结果有点困惑。
那么如何使用 Iconv 或其他工具对从 pdftk 转换为这个 HTML 代码的所有字符进行这种转换呢?
或者当我首先阅读 pdf 文件时如何告诉 pdftk 这样做!
forms - 用 pdftk 填写后保持 pdf 表单可编辑
我正在使用 pdftk 填写表单,但输出表单不可编辑,当我在 acrobat 阅读器上打开它时,我收到一条错误消息:“此文档在 Adobe Reader 中启用了扩展功能,该文档已更改,因为它已创建,并且无法再使用扩展功能。”
是否可以保持文档可编辑?
pdf - pdftk 和 qpdf 重置 PDF 评论安全性
为了能够在 linux 中为 pdf 文件添加注释,我必须重置 pdf 文档中的“评论”安全设置。
qpdf --decrypt input.pdf output.pdf
应该删除任何密码或“加密”(根据这篇文章)
pdftk input input.pdf output output.pdf allow AllFeatures
应将所有文件证券(包括“评论”)设置为允许
应用这两个命令后,在 acroread 中我仍然可以看到(文件-> 文档-> 安全选项卡)不允许评论。
如何重置此安全属性?
php - PHP强制PDF下载不适用于Android上的浏览器
我使用 POST 请求来传输动态创建可下载文档所需的数据。
提交表单时,$_POST 数组被传递给一个函数,该函数返回创建的 FDF 文件的路径。
编码:
适用于所有浏览器(Safari、Firefox、Opera、Chrome、Internet Explorer),但不适用于 Android 库存浏览器。
在 Android 浏览器中,下载发生但文件内容为空或一些 HTML 垃圾,或者浏览器下载文件但忽略我的文件名并尝试将文件保存在生成它的脚本的名称下。
任何帮助深表感谢。
谢谢!
更新!!!
解决方案: http: //digiblog.de/2011/04/19/android-and-the-download-file-headers/
linux - 修复明显损坏的 pdf 并减小文件大小
我有一个 PDF 文件(4.6MB),它是通过pdftk
在 Ubuntu 12.04 中使用 6 个不同的 PDF(包含文本和位图图形)组合而成的。我希望在不影响其质量的情况下将此文件压缩到接近 2MB 的大小。
我尝试了 pdftk 的“压缩”选项(无法将其压缩到 2 MB),还尝试先将其转换为 ps,然后再转换为 pdf,它给出了以下警告:
****警告:将“0000000000 XXXXX n”视为免费条目。
然后挂起。qpdf
也未能说文件已损坏。
有人可以帮我吗?
php - PDFTK 位置(500 内部错误)
所以我安装了 PDFTK,并且在根目录中似乎可以工作。(IE:/public_html/)但是,一旦我将脚本移动到“文件夹”(IE:/public_html/test/)中,它就会形成 500 内部服务器错误。
这是我拥有并测试过的代码。
这些选项似乎都返回相同的错误 (500)。奇怪的是,当我在站点的根目录中运行它时,它运行良好。
任何帮助,将不胜感激。
node.js - 为什么通过 pdftk 将多页 PDF 重复突发到单个页面会更改这些页面的 md5 校验和?
我正在使用pdftk并进行一些测试,发现将多页 PDF 文件分解为单独的单页 PDF 文件,然后为每个单页 PDF 生成一个 md5 哈希校验和(数字指纹),每次我都会产生不同的哈希做爆发。这就是结果,即使它是完全相同的文件而没有任何更改。
我的测试过程是:
- 解压 test.pdf(包含 10 页的简单纯文本 PDF)
- 使用 pdftk,将 test.pdf 爆裂(拆分)成 10 个单独的 PDF 文件(每个文件 1 页)
- 为 10 个单页 PDF 文件中的每一个生成 md5 哈希校验和
- 记录 10 个哈希校验和
- 重复步骤 1-4
- 请注意,所有哈希值都不同
旁注:解压缩后在 PDF 上生成校验和会在重复时产生完全相同的校验和。
我的问题是:为什么校验和在重复时会有所不同?我认为生成的 10 个单页文件与上次创建它们时完全相同。他们的父文档(以及各个页面本身)根本没有改变。
php - 在共享 Web 服务器上安装 PDFTK
我的网站使用某种 Linux(我不知道确切的种类)和 Apache 托管在 Total Choice Hosting 上。我没有命令行访问权限 - 我只能通过 PHP 中的 exec() 或通过 CRON 作业运行命令行程序。
我可以在这样的系统上安装和使用 PDFTK 吗?
如果是这样,我到底该怎么做?我必须将哪些文件复制到哪里?我是否必须从源代码重建 PDFTK,或者某处是否有可执行版本?
因为(据我了解)PDFTK 基于 iText,它是用 Java 编写的。也许我最好使用原始的 iText 包?
或者有没有更好的方法来做我想做的事情(基本上是将PDF文件(空白表格)与FDF文件(字段值)合并并展平为一个新的PDF文件(完整的表格)并将其下载到用户)?是否有一些本机 PHP 或 Python 或 Perl 代码来执行此操作?
谢谢 - 罗文
php - pdftk + xfdf + php 无法处理变音符号
我正在使用 XFDF 文件用 PHP 和 pdftk 填写 PDF 表单服务器端,但我的问题是没有非英语字符(ä、ö、å 等)打印到表单字段。
这是我用来解析 XFDF 文件的函数:
生成的 XFDF 文件如下所示:
带有英文字母的字段打印完美,但带有锐角、坟墓或斯堪的纳维亚添加的字母不会转移到 PDF 文件中。 出于某种原因除外
完美运行并打印 öä!
我运行的命令是
这不会导致任何错误。
我使用的是 Debian 6.0,PHP 5.3.3-7+squeeze13,pdftk 版本是 1.44-5
更新我注意到,如果我不展平生成的文件并打开它,则在激活字段时字符会正确打印,但在字段未聚焦时会再次隐藏。如果我手动在文件中键入任何内容,特殊字符也会显示出来。但是,除非再次添加一些文本,否则保存并重新打开的文件不会显示文本。
更新 2修复了该死的东西。最初这些表格是在 OSX Snow Leopard 上使用 Adobe Acrobat Pro 制作的。现在我用 LibreOffice + Oracle PDF Import 插件重新制作了表格,一切似乎都在工作!