问题标签 [pdfa]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
1063 浏览

pdf - 如何使用具有 PDFA-2 或 PDF/A-3 一致性级别的 PdfCopy/PdfStamper 打开 PDF/A-1 文档

我仍在尝试从 PDF 转换为 PDF/A,从 PDF/A-1 转换为 PDF/A-2,从 PDF/A-2 转换为 PDF/A-3。如您所见,我的目标是从现有的 PDF 文件实现 PDF/A-3 一致性文件。

将 PDF/A-1 转换为 PDF/A-2b 的问题在于它不起作用。我正在尝试使用 PdfACopy 打开一个 PDF/A-1 一致性 pdf 文件,该文件将创建一个 PDF/A-2 一致性文件,但是会发生此错误。

不同的 PDF/A 版本。

这是我的代码的一小部分摘录:

如何创建或转换这些 PDF?我是否需要从原始文件中读取元数据,更改 PDF/a 版本,再次读取然后更改?

请告诉我如何转换这些文件。我只想要一个 PDF-A3 一致性文件。

0 投票
1 回答
679 浏览

xml - FOP PDF/A-3b 不允许嵌入文件

我正在尝试使用 fop 2.1 将 xml 文件嵌入到 PDF/A3-b 文件中并得到以下答案:

这是我的 .fo 文件

fop.xconf 文件已按照 fop网站上的描述进行了扩展。

最后是来自我的 bash shell 的执行命令

使用 -c 但不使用该块执行可以正常工作。
不使用 -c 但使用块执行也可以。

是“完全使用这个 fop.xconv 文件”的命令。

我错过了什么吗?

0 投票
1 回答
1845 浏览

pdf - Ghostscript PDF 到 PDF/A 转换字体问题

我正在探索将 PDF 文档转换为 PDF/A 的工具。Ghostscript 似乎为这种转换提供了开箱即用的支持。一个问题似乎是作为原始 PDF 文档一部分的某些真字体没有正确转换。如果我从转换后的 PDF/A 文档中复制文本并将其粘贴到记事本中,则复制的文本似乎是乱码。

原始文档文本可以复制到记事本就好了。

我正在使用以下脚本:

我在 Google Drive 中上传了一个示例 1 页源 PDF: SampleInput

从该命令生成的示例输出 PDF/A 文档位于 Google 驱动器中: SampleOutput

在 Windows 机器上对此 PDF 运行上述查询将重现该问题。

是否有任何设置/命令可以正确处理 PDF/A 转换?

0 投票
1 回答
2260 浏览

pdf - Ghostscript - 将 PDF 转换为 PDF/A

我在 linux 服务器上使用此命令将 PDF 文件转换为 PDF/A,它可以正常工作:

我唯一担心的是图形质量。我最初的 PDF 有 1.5MB,转换后的只有 500kb。图形质量降低。

关于如何保持初始 pdf 质量的任何想法?

0 投票
1 回答
6357 浏览

java - 如何将报告导出为 PDF/A-1a、PDF/A-1b?

在 jasper-report 中生成 PDF/A 包含许多缺陷,并且在某些版本的 jasper-report 中不受支持。这就是为什么我决定通过这个问题-回答帖子,指出将带有图表的简单报告导出为 PDF/A 所需的步骤和库版本

样本数据(usersRep.csv)

示例 jrxml (reputation.jrxml)

导出为 PDF 的 Java 代码(reputation.pdf)

这会将报告导出为 pdf,我需要做什么来生成 PDF/A-1a?

0 投票
1 回答
177 浏览

java - 来自两个 PDF 的 SHA1 摘要不同,但转换为 PDF/A 时相等

我从 jasper 生成两个 PDF,将相同的参数传递给它们,当我对这两个 PDF 进行哈希处理时,它们的哈希值不同,我认为这是正确的结果,因为它们具有相同的内容,它们是在不同时间创建的。但是当我将这两个 PDF 转换为 PDF/A 时,它们的 sha1 哈希值是相等的。

有人可以帮我解决这个问题吗?这怎么可能?

编辑:

0 投票
1 回答
11610 浏览

pdf - 使用 iText 库将 pdf 转换为 pdf/a

我想将文档导出到 PdfAConformanceLevel.PDF_A_1B 一致性,但是当我执行 document.close 时,出现以下错误,导致 pdf 不可用。

我使用以下 itext 版本:

堆栈跟踪:

我正在使用以下代码生成 PDF:

由于我在其他文件上没有收到错误,这似乎是特定于输入文件 - 这是一个重现错误的文件:我正在尝试转换此输入 pdf 文件: http: //filebin.ca/2hR2xO1SNlzh/09062009073008005.pdf

0 投票
2 回答
588 浏览

pdf - 如何找到 Adob​​e Normalizer 的 TTF 字体名称(即 Times New Roman)

我正在尝试使用 Adob​​e Normalizer 将 PostScript 文件转换为 PDF/A。

我遇到的问题是,如果找不到字体,那就很难停止。我添加了“--ignorestdttfonts=off”,这有点帮助。这是我用于命令字符串的内容:

我在我的 PostScript 文件中使用 /Times-Roman,并且我有 times.ttf 作为安装的字体,但我收到此错误:

所以我有两个问题:

  1. 给定一个 TTF 文件,我如何确切知道 Adob​​e Normalizer 使用什么字体名称?
  2. 找不到字体时如何替换字体?默认是使用 Courier,但这似乎没有发生。我明确添加了“--allowdefaultfont=on --defaultfont=Courier”,但没有效果。
0 投票
1 回答
915 浏览

xml - pdf/a 验证:pdfaExtension:schemas/*[1] :: 值类型“Schema”中缺少必填字段“valueType”

我用 tcpdf 库在 php 中创建了一个 pdf/a-1b,但没有通过这些错误的验证( http://www.pdf-tools.com/pdf/validate-pdfa-online.aspx ):

pdfaExtension:schemas/ [0] :: 值类型“Schema”中缺少必填字段“valueType”。pdfaExtension:schemas/ [1] :: 值类型“Schema”中缺少必填字段“valueType”。pdfaExtension:schemas/*[2] :: 值类型“Schema”中缺少必填字段“valueType”。

我该如何解决这个错误?缺少什么价值?在哪里?

谢谢你

0 投票
1 回答
744 浏览

pdf - 使用 pdfbox 在 PDF/A-1a 中查找标记的内容

我有一个我认为是由 apache fop 生成的 PDF/A-1a 文件,并且使用 pdfbox 中的 OverlayPDF 放置了一个覆盖信头。preflight 将文件识别为正常(但显然只有 PDF/A-1b)并且 Acroreader 在文档属性中说它是“PDF/A”模式和“标记:是”。我想看看它的外观,以便我可以将 fop 调整为一些小的改进。

我的问题是,我在哪里可以查看标记的内容(即 PDF 中的文本表示是字符输出的紧缩序列),最好不用自己编码,例如使用 pdfbox 中的调试器/PDFReader?我有点迷路了 - 有没有另一种方法可以将文档结构的文本输出例如放入 xml 文件中以使用编辑器进行搜索?- 蒂亚!

编辑

信头本身最初是附言,并使用 ghostscript 转换为 PDF/A-1b,然后覆盖

letter_plain.pdf 是使用 fop 生成的

使用的版本是 pdfbox 2.0 和 fop 1.1。

如果 letter_with_head.pdf 不再是 PDF/A-1a,那么问题将适用于 letter_plain.pdf,根据 fop 调用应该是 1a,必须选择不同的解决方案(如 svg)来获取信头那时。

编辑 2

示例 pdf 可在此处找到:https ://www.magentacloud.de/share/j9qk7jfzyv - 无需单独的 followingpages_letterhead.pdf,因为示例只有一页。

编辑 3

我怀疑文本被埋在下面Root/StructTreeRoot/ParentTree/Nums/[1]/[3]/P/P/P/P/P/P的某个地方(假设 P 以某种方式映射fo:block's)但无法显示 pdf 中的文本。