问题标签 [pdf-manipulation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pdf - 更改现有 PDF 分页的最佳方法
我们有一个生成为 A5 横向页面的 PDF。有了这个,我们需要做一个 A4 纵向页面格式的 PDF,方法是将源 PDF 的 2 页放在结果 PDF 的每一页上。
你知道可以做那种 PDF 操作的好图书馆吗?这应该发生在 ASP.NET Web 应用程序的服务器端,尽可能少地部署在服务器上。
pdf - PDF文档操作
我有几个具有以下属性的 PDF:
每个 PDF 包含可变数量的“文档”,其页数不同。
“文档”中的每一页都有文本,例如“第 3 页,共 26 页”。
我希望能够自动识别 PDF 中每个“文档”的第一页和最后一页(注意:这与 PDF 的第一页和最后一页不同,因为每个 PDF 可能包含多个“文档”)并提取将它们转换成一个新的 PDF 文件供以后打印和存档。
我不确定我可以使用哪些工具来解决这个问题,以及有哪些库可以解决这个问题。
有什么建议吗?最好是免费的,可用于创建将在 Windows 上运行的工具。
c# - 修改可编辑 Pdf 文件中的文本
我正在做一个项目,我需要使用 C# 程序将数据插入到可编辑 pdf文件中的指定字段中。
我不太熟悉可编辑的 pdf 文件和使用 C# 以编程方式修改字段数据。
有谁知道 .net 中可用于填充可编辑 pdf 文件的任何 C# 开源 API?
谢谢
nRk
pdf - 使用 Adobe 的表单输入字段进行 PDF 操作
我正在尝试简化一个过程,我目前使用手动计算每个值的 X 和 Y 坐标。效果很好,但给我带来了很多痛苦,因为我必须做很多 PDF。
我知道我可以打开 PDF 并在 Adobe Acrobat Pro 中插入“输入字段”,如果我可以使用 PHP 连接到这些输入字段并从 PHP 表单中插入一个值,那就太好了。
工作流程::
PHP 表单 >>> PHP 处理引擎 >>> 到最终 PDF,表单值位于 Adobe 输入字段的位置。
如果有人有类似这样的信息,将不胜感激。
c - 在 C 中编辑或删除 PDF 标题信息
我需要编辑几个 PDF 文件的标题信息。我想要实现的是删除之前的所有标题数据%PDF-X.Y.Z
。
我想出的一个可能的解决方案是以二进制模式打开 PDF,读取每个字符直到%PDF-X.Y.Z
找到。然后继续读取流的其余部分并将其保存到新文件中。我认为这样我最终会得到一个精确的 PDF 二进制副本,只是带有不同的标题信息。
在 C 中最简单/最好的方法是什么?是否有任何可用的库可以帮助我做到这一点?我也有兴趣听到解决这个问题的不同方法。
谢谢。
javascript - 在 PDF 文件中使用 JavaScript 代码的文档
在哪里可以找到有关在 PDF 中运行 JavaScript 代码的文档?
我从未在 PDF 文档中添加 JavaScript 操作。但是,我已经使用 JavaScript 进行了相当多的 Web 开发。对于熟悉 PDF 文档中的 JavaScript 的人,我有几个问题。
NitroPDF 和 Adobe Acrobat 绝对支持 PDF 文件中的 JavaScript。是否有关于存在的各种对象的标准以及通过 JavaScript 操作 PDF 文件的功能? 到目前为止,我发现的所有内容都来自 Adobe。其他任何地方似乎都参考了 Adobe 的文档。那里有标准,还是 Adobe 只是“事实上的”标准?
此外,是否所有 PDF 查看器都支持 JavaScript 操作?
我能找到的关于在 PDF 文档中使用 JavaScript 的最佳文档来自 Adobe- Adobe::Acrobat JavaScript Scripting Guide。
NitroPDF 有这个链接 - NitroPDF :: JavaScript in PDF Files,但它基本上只是说它支持 Adobe 所拥有的。
我还从 Scribus - Scribus :: How to enhance your PDF forms with JavaScript中找到了这个链接,但这仅包含一些小代码片段。没有什么超级有用的。
Adobe 有关于如何使用其 IDE 为 JavaScript 设置断点等的文档。是否可以使用另一个 IDE 在 PDF 文件中运行 JavaScript 并具有断点等...?找到像Firebug这样酷的东西会很棒。
笔记:
请不要回答如何操作在网络浏览器中加载的 PDF。问题是关于从 PDF 文档中运行 JavaScript。我正在尝试通过在 PDF 文档中执行 JavaScript 来探索可用的可能性。具体来说,我可以使用quickpdflibrary中的函数将 JavaScript 功能添加到现有文档中。
另一个有用的链接是使用 Acrobat JavaScript 进行开发。显然,PDF 中的 JavaScript 代码通常称为 AcroJS 或 Acrobat JavaScript。
.net - 用于编辑 PDF(或图像)中的敏感数据的 Web 组件
第一个用例 - 在我们的 Web 应用程序中,用户扫描或上传(到服务器)pdf。然后我们让他黑掉一些敏感数据。
现在我写了一些从pdf中提取tiff并将其显示给用户的代码,用户在他想要黑色的地方绘制黑色矩形。然后他将它保存回服务器,我从中创建新的pdf,但我对它的工作方式不满意......
我正在寻找一个为我做这件事的组件(免费的商业)(最好没有图像提取)。
最佳解决方案应该:
- 在 Web 应用程序中显示pdf/图像(只能是 IE)
- 允许用户修改图像(pdf 格式)(向图像添加黑色矩形)
- 允许用户在 pdf中标记一些文本,并将标记文本中的任何字母更改为一个符号(矩形、点等)
- 将pdf/image 保存回服务器。
即使具有部分功能的组件的信息也将不胜感激。组件可能仅限于 IE,并且是免费的和商业的。
python - 使用 PDFMiner 解析没有 /Root 对象的 PDF
我正在尝试使用 PDFMiner python 绑定从大量 PDF 中提取文本。我编写的模块适用于许多 PDF,但是对于 PDF 的子集,我得到了这个有点神秘的错误:
ipython 堆栈跟踪:
当然,我立即检查了这些 PDF 是否已损坏,但它们可以正常阅读。
尽管没有根对象,有没有办法阅读这些 PDF?我不太确定从这里去哪里。
非常感谢!
编辑:
我尝试使用 PyPDF 来获得一些差异诊断。堆栈跟踪如下:
Quonux 建议 PDFMiner 在到达第一个 EOF 字符后停止解析。这似乎暗示了其他情况,但我非常无能为力。有什么想法吗?