问题标签 [pdf-manipulation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
5102 浏览

pdf - 更改现有 PDF 分页的最佳方法

我们有一个生成为 A5 横向页面的 PDF。有了这个,我们需要做一个 A4 纵向页面格式的 PDF,方法是将源 PDF 的 2 页放在结果 PDF 的每一页上。

你知道可以做那种 PDF 操作的好图书馆吗?这应该发生在 ASP.NET Web 应用程序的服务器端,尽可能少地部署在服务器上。

0 投票
3 回答
411 浏览

pdf - PDF文档操作

我有几个具有以下属性的 PDF:

每个 PDF 包含可变数量的“文档”,其页数不同。

“文档”中的每一页都有文本,例如“第 3 页,共 26 页”。

我希望能够自动识别 PDF 中每个“文档”的第一页和最后一页(注意:这与 PDF 的第一页和最后一页不同,因为每个 PDF 可能包含多个“文档”)并提取将它们转换成一个新的 PDF 文件供以后打印和存档。

我不确定我可以使用哪些工具来解决这个问题,以及有哪些库可以解决这个问题。

有什么建议吗?最好是免费的,可用于创建将在 Windows 上运行的工具。

0 投票
2 回答
2190 浏览

pdf - 使用 iText 的 pdf 文件中元素的坐标

我正在使用BIRT报告库创建一个 pdf 文件。稍后我需要对这些文件进行数字签名。我正在使用iText对文档进行数字签名。

我面临的问题是,我需要将签名放在不同报告中的不同位置。我已经有了对文档进行数字签名的代码,现在我总是将签名放在每份报告的最后一页的底部。

最终,我需要每份报告都说明我需要在哪里签名。然后我必须使用 iText 读取位置,然后将签名放在该位置。

这是否可以使用 BIRT 和 iText 来实现

谢谢

0 投票
2 回答
1633 浏览

c# - 修改可编辑 Pdf 文件中的文本


我正在做一个项目,我需要使用 C# 程序将数据插入到可编辑 pdf文件中的指定字段中。

我不太熟悉可编辑的 pdf 文件和使用 C# 以编程方式修改字段数据。
有谁知道 .net 中可用于填充可编辑 pdf 文件的任何 C# 开源 API?

谢谢
nRk

0 投票
2 回答
638 浏览

pdf - 使用 Adob​​e 的表单输入字段进行 PDF 操作

我正在尝试简化一个过程,我目前使用手动计算每个值的 X 和 Y 坐标。效果很好,但给我带来了很多痛苦,因为我必须做很多 PDF。

我知道我可以打开 PDF 并在 Adob​​e Acrobat Pro 中插入“输入字段”,如果我可以使用 PHP 连接到这些输入字段并从 PHP 表单中插入一个值,那就太好了。

工作流程::

PHP 表单 >>> PHP 处理引擎 >>> 到最终 PDF,表单值位于 Adob​​e 输入字段的位置。

如果有人有类似这样的信息,将不胜感激。

0 投票
2 回答
1943 浏览

c - 在 C 中编辑或删除 PDF 标题信息

我需要编辑几个 PDF 文件的标题信息。我想要实现的是删除之前的所有标题数据%PDF-X.Y.Z

我想出的一个可能的解决方案是以二进制模式打开 PDF,读取每个字符直到%PDF-X.Y.Z找到。然后继续读取流的其余部分并将其保存到新文件中。我认为这样我最终会得到一个精确的 PDF 二进制副本,只是带有不同的标题信息。

在 C 中最简单/最好的方法是什么?是否有任何可用的库可以帮助我做到这一点?我也有兴趣听到解决这个问题的不同方法。

谢谢。

0 投票
3 回答
2743 浏览

pdf - 使用 ghostscript 和 pdfmark 更新 pdf 元数据时编码错误

0 投票
5 回答
111172 浏览

javascript - 在 PDF 文件中使用 JavaScript 代码的文档

在哪里可以找到有关在 PDF 中运行 JavaScript 代码的文档?

我从未在 PDF 文档中添加 JavaScript 操作。但是,我已经使用 JavaScript 进行了相当多的 Web 开发。对于熟悉 PDF 文档中的 JavaScript 的人,我有几个问题。

NitroPDF 和 Adob​​e Acrobat 绝对支持 PDF 文件中的 JavaScript。是否有关于存在的各种对象的标准以及通过 JavaScript 操作 PDF 文件的功能? 到目前为止,我发现的所有内容都来自 Adob​​e。其他任何地方似乎都参考了 Adob​​e 的文档。那里有标准,还是 Adob​​e 只是“事实上的”标准?

此外,是否所有 PDF 查看器都支持 JavaScript 操作?

我能找到的关于在 PDF 文档中使用 JavaScript 的最佳文档来自 Adob​​e- Adobe::Acrobat JavaScript Scripting Guide

NitroPDF 有这个链接 - NitroPDF :: JavaScript in PDF Files,但它基本上只是说它支持 Adob​​e 所拥有的。

我还从 Scribus - Scribus :: How to enhance your PDF forms with JavaScript中找到了这个链接,但这仅包含一些小代码片段。没有什么超级有用的。

Adobe 有关于如何使用其 IDE 为 JavaScript 设置断点等的文档。是否可以使用另一个 IDE 在 PDF 文件中运行 JavaScript 并具有断点等...?找到像Firebug这样酷的东西会很棒。

笔记:

请不要回答如何操作在网络浏览器中加载的 PDF。问题是关于从 PDF 文档中运行 JavaScript。我正在尝试通过在 PDF 文档中执行 JavaScript 来探索可用的可能性。具体来说,我可以使用quickpdflibrary中的函数将 JavaScript 功能添加到现有文档中。

另一个有用的链接是使用 Acrobat JavaScript 进行开发。显然,PDF 中的 JavaScript 代码通常称为 AcroJS 或 Acrobat JavaScript。

0 投票
4 回答
1265 浏览

.net - 用于编辑 PDF(或图像)中的敏感数据的 Web 组件

第一个用例 - 在我们的 Web 应用程序中,用户扫描或上传(到服务器)pdf。然后我们让他黑掉一些敏感数据。

现在我写了一些从pdf中提取tiff并将其显示给用户的代码,用户在他想要黑色的地方绘制黑色矩形。然后他将它保存回服务器,我从中创建新的pdf,但我对它的工作方式不满意......

我正在寻找一个为我做这件事的组件(免费的商业)(最好没有图像提取)。

最佳解决方案应该:

  1. 在 Web 应用程序中显示pdf/图像(只能是 IE)
  2. 允许用户修改图像(pdf 格式)(向图像添加黑色矩形)
  3. 允许用户在 pdf中标记一些文本,并将标记文本中的任何字母更改为一个符号(矩形、点等)
  4. pdf/image 保存回服务器。

即使具有部分功能的组件的信息也将不胜感激。组件可能仅限于 IE,并且是免费的和商业的。

0 投票
5 回答
15659 浏览

python - 使用 PDFMiner 解析没有 /Root 对象的 PDF

我正在尝试使用 PDFMiner python 绑定从大量 PDF 中提取文本。我编写的模块适用于许多 PDF,但是对于 PDF 的子集,我得到了这个有点神秘的错误:

ipython 堆栈跟踪:

当然,我立即检查了这些 PDF 是否已损坏,但它们可以正常阅读。

尽管没有根对象,有没有办法阅读这些 PDF?我不太确定从这里去哪里。

非常感谢!

编辑:

我尝试使用 PyPDF 来获得一些差异诊断。堆栈跟踪如下:

Quonux 建议 PDFMiner 在到达第一个 EOF 字符后停止解析。这似乎暗示了其他情况,但我非常无能为力。有什么想法吗?