问题标签 [pdftk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何以编程方式确定 PDF 是否可搜索?
我有一个带有 PDF 的 URL 列表的 CSV:
- 其中一些 PDF 是可搜索的。
- 其中一些 PDF 文件不可搜索。
我想确定可以从我的 PDF 列表中搜索哪些 PDF。是否有捷径可寻?
android - 如何在移动设备上的 Django 中提供动态 pdf
使用pdftk
我生成一些动态的临时 pdf 文件,然后 Django 将其提供给用户。
在桌面上,它工作正常 - pdf文件打开,然后用户可以保存,但是在所有浏览器的我的android手机上(可能在iOS上相同,但没有iOS设备所以无法测试),pdf确实没有下载成功。它开始下载,但总是失败,我不知道为什么。
以下是生成 pdf 二进制数据的视图和函数的片段:
关于为什么会发生这种情况的任何想法?
vbscript - 使用 pdftk 合并多个位置的 PDF
我正在尝试从批处理或 VBS 脚本文件合并多个 PDF 调用 pdftk。问题是 PDF 都位于公共父目录中的子文件夹中。示例:父文件夹 > subfolder1, subfolder2, subfolder3,其中脚本/BAT 文件位于父文件夹中,每个子文件夹包含一个 PDF。
pdftk 调用如下:pdftk.exe * .pdf cat output OutputFile.pdf
不过,这只会合并当前目录中的 PDF,而不是子文件夹中的 PDF。有没有办法执行以下操作之一:
- 使用 VBS/BAT 文件将子文件夹中的所有 PDF 复制到另一个目录,如果某些子文件夹为空,则不会出错
- 让 pdftk 查看子文件夹以选择要合并的 PDF
任何帮助,将不胜感激。
php - 使用 PHP 将 HTML 表单数据转换为 PDF 文件
我已经寻找和测试了几天了,想知道是否有人可以指出我不同的方向。我有一个很长的工作申请 HTML 表单 (jobapp.html) 和一个匹配的 PDF (jobpdf.pdf),它们对于 HTML 表单和 PDF 中的所有条目具有相同的字段名称。我需要获取表单中输入的用户数据并将其转换为 PDF。这是我到目前为止收集的内容,但不知道我是否走上了正轨:
pdftk 是唯一可行的第 3 方应用程序吗?
使用 pdftk 我会获取为用户收集的 $_POST 数据并生成 .fdf(user.fdf) 然后将 .fdf 展平在 .pdf(job.pdf) 上。因此,不管每个文档上的字段位于何处,fdf 上的信息都会按字段名称填充 pdf?
我一直在尝试 http://koivi.com/fill-pdf-form-fields/tutorial.php
我还查看了“将 HTML 表单提交到 PDF ”
php - 使用 PHP 从 html 表单转换为 PDF
可能重复:
使用 PHP 填写 PDF 表单
我已经寻找和测试了几天了,想知道是否有人可以指出我不同的方向。我有一个很长的工作申请 HTML 表单 (jobapp.html) 和一个匹配的 PDF (jobpdf.pdf),它们对于 HTML 表单和 PDF 中的所有条目具有相同的字段名称。我需要获取表单中输入的用户数据并将其转换为 PDF。这是我到目前为止收集的内容,但不知道我是否走上了正轨:
pdftk 是唯一可行的第 3 方应用程序吗?
使用 pdftk 我会获取为用户收集的 $_POST 数据并生成 .fdf(user.fdf) 然后将 .fdf 展平在 .pdf(job.pdf) 上。因此,无论每个文档上的字段位于何处,fdf 上的信息都会按字段名称填充 pdf?
php - 使用 pdftk 实用程序的 PHP exec() 的安全性
我有兴趣通过从 PHP 脚本调用pdftk(pdft 工具包)来使用它。我打算为此使用该exec()
功能。该命令将遵循以下格式:
pdftk [form_file] fill_form [data_file] output [output_file] flatten
此命令采用表单 PDF 文件 ( form_file
) 并插入 FDF 数据data_file
并将表单展平并将其另存为output_file
.
这是我想通过类似的功能来确保执行此命令的方法exec()
- 目录和文件名不是用户定义的。目录和文件名是根据经过清理的标识符字符串生成的,并且仅包含字母数字字符、破折号、下划线和句点。标识符字符串将具有有限的实用长度。
escapeshellarg()
参数(文件名)在连接到命令之前会被传递(尽管如果后续步骤没有漏洞,这可能是不必要的)。- 整个命令通过
escapeshellcmd()
.
在执行此命令时,我是否忽略了任何安全漏洞?(我现在唯一能想到的是 pdftk 本身是否存在漏洞以及它如何处理文件。)有什么改进这个过程的建议吗?谢谢。
cmd - 在共享文件服务器上运行 pdftk
我在共享文件服务器上安装了 pdftk,它在服务器本身上运行良好。
是否可以从可以访问文件服务器但本身没有安装 pdftk 的另一台计算机运行 pdftk?
任何帮助将非常感激。
php - 使用 pdftk 在 PHP 中基于批量模板生成 pdf
我正在基于模板批量生成 pdf 文件,但很快就遇到了很大的性能问题。我目前的情况如下:
- 从 db 获取要填充的数据
- 基于单个数据行和pdf表单创建fdf
- 将
.fdf
文件写入磁盘 - 使用 pdftk (fill_form with flatten 命令) 将 pdf 与 fdf 合并
- 继续迭代行,直到
.pdf
生成所有的 - 最后将所有生成的文件合并在一起,并将单个pdf提供给客户端
我使用passthru
将原始输出提供给客户端(节省写入文件的时间),但这只是一点性能改进。200 条记录的总操作时间约为 50 秒,我想以某种方式缩短到至少 10 秒。
理想的情况是在内存中操作所有这些 pdf,而不是将它们中的每一个都写入单独的文件,但是由于我无法将这种数据传递给像 pdftk 这样的外部工具,所以输出将是不可能的。另一个想法是生成一个.fdf
包含所有这些行的大文件,但看起来这是不允许的。
我在这里错过了一些非常微不足道的东西吗?
我很感谢您的任何建议。
PS。我知道我可以使用一些好的库,比如 pdflib,但我现在只考虑开放许可库。
编辑:
我正在弄清楚.fdf
使用相同的pdf作为模板构建具有多个页面的文件的语法,花了几个小时但找不到任何好的文档。
pdf - Ghostscript 脚本或其他,从两个多页 pdf 文件中交错奇数页和偶数页
我的扫描仪有进纸但没有双面扫描。因此,如果我扫描打印在纸张两面的多页文档,我将得到两个 pdf 文件,一个包含所有奇数页(奇数页 pdf 文件),另一个包含所有偶数页(偶数页 pdf 文件)。
我觉得应该可以有一个 Ghostscript 脚本来合并这两个文件,从而使偶数页 pdf 文件中的每一页都像其他页面一样添加到奇数页 pdf 文件中。
有人知道该怎么做吗?
优选地,脚本将采用参数,以便第一个参数指定输出文件,第二个参数指定奇数页 pdf 文件,第三个参数指定偶数页 pdf 文件。
python - 试图将一个大的 .pdf 拆分为多个文件。(蟒蛇,pdftk)
我用 Python 编写了一个脚本,它将按章节/书签拆分 .pdf。这基本上是我的程序的症结所在:
该工具包工作得很好,但一遍又一遍地调用它显然不是一项省时的任务。解析一个 200mb 的 .pdf 文件需要 15-20 秒的时间,而在大约 30 个单独的章节中这样做需要很长时间。打开文件所花费的时间比实际写入任何数据所花费的时间更多。
由于似乎没有在工具包中对多个命令进行字符串处理的固有方法,因此我可以在 Python 或 CMD 中提取任何内存技巧来解决这个问题(即保持 .pdf 打开)?如果你能推荐一个模块,我也会看看另一个模块(虽然 pyPdf有它自己的一系列问题)。