问题标签 [pdfa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pdf - 如何使用具有 PDFA-2 或 PDF/A-3 一致性级别的 PdfCopy/PdfStamper 打开 PDF/A-1 文档
我仍在尝试从 PDF 转换为 PDF/A,从 PDF/A-1 转换为 PDF/A-2,从 PDF/A-2 转换为 PDF/A-3。如您所见,我的目标是从现有的 PDF 文件实现 PDF/A-3 一致性文件。
将 PDF/A-1 转换为 PDF/A-2b 的问题在于它不起作用。我正在尝试使用 PdfACopy 打开一个 PDF/A-1 一致性 pdf 文件,该文件将创建一个 PDF/A-2 一致性文件,但是会发生此错误。
不同的 PDF/A 版本。
这是我的代码的一小部分摘录:
如何创建或转换这些 PDF?我是否需要从原始文件中读取元数据,更改 PDF/a 版本,再次读取然后更改?
请告诉我如何转换这些文件。我只想要一个 PDF-A3 一致性文件。
xml - FOP PDF/A-3b 不允许嵌入文件
我正在尝试使用 fop 2.1 将 xml 文件嵌入到 PDF/A3-b 文件中并得到以下答案:
这是我的 .fo 文件
fop.xconf 文件已按照 fop网站上的描述进行了扩展。
最后是来自我的 bash shell 的执行命令
使用 -c 但不使用该块执行可以正常工作。
不使用 -c 但使用块执行也可以。
是“完全使用这个 fop.xconv 文件”的命令。
我错过了什么吗?
pdf - Ghostscript PDF 到 PDF/A 转换字体问题
我正在探索将 PDF 文档转换为 PDF/A 的工具。Ghostscript 似乎为这种转换提供了开箱即用的支持。一个问题似乎是作为原始 PDF 文档一部分的某些真字体没有正确转换。如果我从转换后的 PDF/A 文档中复制文本并将其粘贴到记事本中,则复制的文本似乎是乱码。
原始文档文本可以复制到记事本就好了。
我正在使用以下脚本:
我在 Google Drive 中上传了一个示例 1 页源 PDF: SampleInput
从该命令生成的示例输出 PDF/A 文档位于 Google 驱动器中: SampleOutput
在 Windows 机器上对此 PDF 运行上述查询将重现该问题。
是否有任何设置/命令可以正确处理 PDF/A 转换?
pdf - Ghostscript - 将 PDF 转换为 PDF/A
我在 linux 服务器上使用此命令将 PDF 文件转换为 PDF/A,它可以正常工作:
我唯一担心的是图形质量。我最初的 PDF 有 1.5MB,转换后的只有 500kb。图形质量降低。
关于如何保持初始 pdf 质量的任何想法?
java - 如何将报告导出为 PDF/A-1a、PDF/A-1b?
在 jasper-report 中生成 PDF/A 包含许多缺陷,并且在某些版本的 jasper-report 中不受支持。这就是为什么我决定通过这个问题-回答帖子,指出将带有图表的简单报告导出为 PDF/A 所需的步骤和库版本
样本数据(usersRep.csv)
示例 jrxml (reputation.jrxml)
导出为 PDF 的 Java 代码(reputation.pdf)
这会将报告导出为 pdf,我需要做什么来生成 PDF/A-1a?
java - 来自两个 PDF 的 SHA1 摘要不同,但转换为 PDF/A 时相等
我从 jasper 生成两个 PDF,将相同的参数传递给它们,当我对这两个 PDF 进行哈希处理时,它们的哈希值不同,我认为这是正确的结果,因为它们具有相同的内容,它们是在不同时间创建的。但是当我将这两个 PDF 转换为 PDF/A 时,它们的 sha1 哈希值是相等的。
有人可以帮我解决这个问题吗?这怎么可能?
编辑:
pdf - 使用 iText 库将 pdf 转换为 pdf/a
我想将文档导出到 PdfAConformanceLevel.PDF_A_1B 一致性,但是当我执行 document.close 时,出现以下错误,导致 pdf 不可用。
我使用以下 itext 版本:
堆栈跟踪:
我正在使用以下代码生成 PDF:
由于我在其他文件上没有收到错误,这似乎是特定于输入文件 - 这是一个重现错误的文件:我正在尝试转换此输入 pdf 文件: http: //filebin.ca/2hR2xO1SNlzh/09062009073008005.pdf
pdf - 如何找到 Adobe Normalizer 的 TTF 字体名称(即 Times New Roman)
我正在尝试使用 Adobe Normalizer 将 PostScript 文件转换为 PDF/A。
我遇到的问题是,如果找不到字体,那就很难停止。我添加了“--ignorestdttfonts=off”,这有点帮助。这是我用于命令字符串的内容:
我在我的 PostScript 文件中使用 /Times-Roman,并且我有 times.ttf 作为安装的字体,但我收到此错误:
所以我有两个问题:
- 给定一个 TTF 文件,我如何确切知道 Adobe Normalizer 使用什么字体名称?
- 找不到字体时如何替换字体?默认是使用 Courier,但这似乎没有发生。我明确添加了“--allowdefaultfont=on --defaultfont=Courier”,但没有效果。
xml - pdf/a 验证:pdfaExtension:schemas/*[1] :: 值类型“Schema”中缺少必填字段“valueType”
我用 tcpdf 库在 php 中创建了一个 pdf/a-1b,但没有通过这些错误的验证( http://www.pdf-tools.com/pdf/validate-pdfa-online.aspx ):
pdfaExtension:schemas/ [0] :: 值类型“Schema”中缺少必填字段“valueType”。pdfaExtension:schemas/ [1] :: 值类型“Schema”中缺少必填字段“valueType”。pdfaExtension:schemas/*[2] :: 值类型“Schema”中缺少必填字段“valueType”。
我该如何解决这个错误?缺少什么价值?在哪里?
谢谢你
pdf - 使用 pdfbox 在 PDF/A-1a 中查找标记的内容
我有一个我认为是由 apache fop 生成的 PDF/A-1a 文件,并且使用 pdfbox 中的 OverlayPDF 放置了一个覆盖信头。preflight 将文件识别为正常(但显然只有 PDF/A-1b)并且 Acroreader 在文档属性中说它是“PDF/A”模式和“标记:是”。我想看看它的外观,以便我可以将 fop 调整为一些小的改进。
我的问题是,我在哪里可以查看标记的内容(即 PDF 中的文本表示是字符输出的紧缩序列),最好不用自己编码,例如使用 pdfbox 中的调试器/PDFReader?我有点迷路了 - 有没有另一种方法可以将文档结构的文本输出例如放入 xml 文件中以使用编辑器进行搜索?- 蒂亚!
编辑
信头本身最初是附言,并使用 ghostscript 转换为 PDF/A-1b,然后覆盖
letter_plain.pdf 是使用 fop 生成的
使用的版本是 pdfbox 2.0 和 fop 1.1。
如果 letter_with_head.pdf 不再是 PDF/A-1a,那么问题将适用于 letter_plain.pdf,根据 fop 调用应该是 1a,必须选择不同的解决方案(如 svg)来获取信头那时。
编辑 2
示例 pdf 可在此处找到:https ://www.magentacloud.de/share/j9qk7jfzyv - 无需单独的 followingpages_letterhead.pdf,因为示例只有一页。
编辑 3
我怀疑文本被埋在下面Root/StructTreeRoot/ParentTree/Nums/[1]/[3]/P/P/P/P/P/P
的某个地方(假设 P 以某种方式映射fo:block
's)但无法显示 pdf 中的文本。