“pdfa”的相关标签问题_Stack Overflow中文网

0 投票

0 回答

1063 浏览

pdf - 如何使用具有 PDFA-2 或 PDF/A-3 一致性级别的 PdfCopy/PdfStamper 打开 PDF/A-1 文档

我仍在尝试从 PDF 转换为 PDF/A，从 PDF/A-1 转换为 PDF/A-2，从 PDF/A-2 转换为 PDF/A-3。如您所见，我的目标是从现有的 PDF 文件实现 PDF/A-3 一致性文件。

将 PDF/A-1 转换为 PDF/A-2b 的问题在于它不起作用。我正在尝试使用 PdfACopy 打开一个 PDF/A-1 一致性 pdf 文件，该文件将创建一个 PDF/A-2 一致性文件，但是会发生此错误。

不同的 PDF/A 版本。

这是我的代码的一小部分摘录：

如何创建或转换这些 PDF？我是否需要从原始文件中读取元数据，更改 PDF/a 版本，再次读取然后更改？

请告诉我如何转换这些文件。我只想要一个 PDF-A3 一致性文件。

2016-01-05T08:40:44.700

0 投票

1 回答

679 浏览

xml - FOP PDF/A-3b 不允许嵌入文件

我正在尝试使用 fop 2.1 将 xml 文件嵌入到 PDF/A3-b 文件中并得到以下答案：

这是我的 .fo 文件

fop.xconf 文件已按照 fop网站上的描述进行了扩展。

最后是来自我的 bash shell 的执行命令

使用 -c 但不使用该块执行可以正常工作。
不使用 -c 但使用块执行也可以。

是“完全使用这个 fop.xconv 文件”的命令。

我错过了什么吗？

xml apache-fop pdfa

2016-01-26T13:36:25.297

0 投票

1 回答

1845 浏览

pdf - Ghostscript PDF 到 PDF/A 转换字体问题

我正在探索将 PDF 文档转换为 PDF/A 的工具。Ghostscript 似乎为这种转换提供了开箱即用的支持。一个问题似乎是作为原始 PDF 文档一部分的某些真字体没有正确转换。如果我从转换后的 PDF/A 文档中复制文本并将其粘贴到记事本中，则复制的文本似乎是乱码。

原始文档文本可以复制到记事本就好了。

我正在使用以下脚本：

我在 Google Drive 中上传了一个示例 1 页源 PDF： SampleInput

从该命令生成的示例输出 PDF/A 文档位于 Google 驱动器中： SampleOutput

在 Windows 机器上对此 PDF 运行上述查询将重现该问题。

是否有任何设置/命令可以正确处理 PDF/A 转换？

pdf fonts ghostscript pdfa

2016-01-31T16:22:08.773

0 投票

1 回答

2260 浏览

pdf - Ghostscript - 将 PDF 转换为 PDF/A

我在 linux 服务器上使用此命令将 PDF 文件转换为 PDF/A，它可以正常工作：

我唯一担心的是图形质量。我最初的 PDF 有 1.5MB，转换后的只有 500kb。图形质量降低。

关于如何保持初始 pdf 质量的任何想法？

pdf ghostscript pdfa

2016-03-02T11:24:59.917

0 投票

1 回答

6357 浏览

java - 如何将报告导出为 PDF/A-1a、PDF/A-1b？

在 jasper-report 中生成 PDF/A 包含许多缺陷，并且在某些版本的 jasper-report 中不受支持。这就是为什么我决定通过这个问题-回答帖子，指出将带有图表的简单报告导出为 PDF/A 所需的步骤和库版本

样本数据（usersRep.csv）

示例 jrxml (reputation.jrxml)

导出为 PDF 的 Java 代码(reputation.pdf)

这会将报告导出为 pdf，我需要做什么来生成 PDF/A-1a？

java jasper-reports pdf-generation export-to-pdf pdfa

2016-03-30T10:29:17.317

0 投票

1 回答

177 浏览

java - 来自两个 PDF 的 SHA1 摘要不同，但转换为 PDF/A 时相等

我从 jasper 生成两个 PDF，将相同的参数传递给它们，当我对这两个 PDF 进行哈希处理时，它们的哈希值不同，我认为这是正确的结果，因为它们具有相同的内容，它们是在不同时间创建的。但是当我将这两个 PDF 转换为 PDF/A 时，它们的 sha1 哈希值是相等的。

有人可以帮我解决这个问题吗？这怎么可能？

编辑：

java hash pdfa

2016-04-12T20:07:32.993

0 投票

1 回答

11610 浏览

pdf - 使用 iText 库将 pdf 转换为 pdf/a

我想将文档导出到 PdfAConformanceLevel.PDF_A_1B 一致性，但是当我执行 document.close 时，出现以下错误，导致 pdf 不可用。

我使用以下 itext 版本：

堆栈跟踪：

我正在使用以下代码生成 PDF：

由于我在其他文件上没有收到错误，这似乎是特定于输入文件 - 这是一个重现错误的文件：我正在尝试转换此输入 pdf 文件： http: //filebin.ca/2hR2xO1SNlzh/09062009073008005.pdf

pdf itext pdfa

2016-05-17T06:08:40.653

0 投票

2 回答

588 浏览

pdf - 如何找到 Adobe Normalizer 的 TTF 字体名称（即 Times New Roman）

我正在尝试使用 Adobe Normalizer 将 PostScript 文件转换为 PDF/A。

我遇到的问题是，如果找不到字体，那就很难停止。我添加了“--ignorestdttfonts=off”，这有点帮助。这是我用于命令字符串的内容：

我在我的 PostScript 文件中使用 /Times-Roman，并且我有 times.ttf 作为安装的字体，但我收到此错误：

所以我有两个问题：

给定一个 TTF 文件，我如何确切知道 Adobe Normalizer 使用什么字体名称？
找不到字体时如何替换字体？默认是使用 Courier，但这似乎没有发生。我明确添加了“--allowdefaultfont=on --defaultfont=Courier”，但没有效果。

pdf adobe truetype postscript pdfa

2016-05-21T00:00:07.323

0 投票

1 回答

915 浏览

xml - pdf/a 验证：pdfaExtension:schemas/*[1] :: 值类型“Schema”中缺少必填字段“valueType”

我用 tcpdf 库在 php 中创建了一个 pdf/a-1b，但没有通过这些错误的验证（ http://www.pdf-tools.com/pdf/validate-pdfa-online.aspx ）：

pdfaExtension:schemas/ [0] :: 值类型“Schema”中缺少必填字段“valueType”。pdfaExtension:schemas/ [1] :: 值类型“Schema”中缺少必填字段“valueType”。pdfaExtension:schemas/*[2] :: 值类型“Schema”中缺少必填字段“valueType”。

我该如何解决这个错误？缺少什么价值？在哪里？

谢谢你

xml validation pdfa

2016-06-13T20:02:44.807

0 投票

1 回答

744 浏览

pdf - 使用 pdfbox 在 PDF/A-1a 中查找标记的内容

我有一个我认为是由 apache fop 生成的 PDF/A-1a 文件，并且使用 pdfbox 中的 OverlayPDF 放置了一个覆盖信头。preflight 将文件识别为正常（但显然只有 PDF/A-1b）并且 Acroreader 在文档属性中说它是“PDF/A”模式和“标记：是”。我想看看它的外观，以便我可以将 fop 调整为一些小的改进。

我的问题是，我在哪里可以查看标记的内容（即 PDF 中的文本表示是字符输出的紧缩序列），最好不用自己编码，例如使用 pdfbox 中的调试器/PDFReader？我有点迷路了 - 有没有另一种方法可以将文档结构的文本输出例如放入 xml 文件中以使用编辑器进行搜索？- 蒂亚！

编辑

信头本身最初是附言，并使用 ghostscript 转换为 PDF/A-1b，然后覆盖

letter_plain.pdf 是使用 fop 生成的

使用的版本是 pdfbox 2.0 和 fop 1.1。

如果 letter_with_head.pdf 不再是 PDF/A-1a，那么问题将适用于 letter_plain.pdf，根据 fop 调用应该是 1a，必须选择不同的解决方案（如 svg）来获取信头那时。

编辑 2

示例 pdf 可在此处找到：https ://www.magentacloud.de/share/j9qk7jfzyv - 无需单独的 followingpages_letterhead.pdf，因为示例只有一页。

编辑 3

我怀疑文本被埋在下面Root/StructTreeRoot/ParentTree/Nums/[1]/[3]/P/P/P/P/P/P的某个地方（假设 P 以某种方式映射fo:block's）但无法显示 pdf 中的文本。

pdf pdfbox apache-fop pdfa

2016-06-22T08:01:38.257

问题标签 [pdfa]

Reference