问题标签 [tagged-pdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4388 浏览

java - 用 PDFBox 标记的 PDF

是否可以使用 PDFBox 创建标记的 PDF(PDF/UA)?看起来 PDFBox 有一个 API(包org.apache.pdfbox.pdmodel.documentinterchange.taggedpdf),但我找不到任何教程或代码示例。

使用下面的代码,我生成了一个包含图像的 PDF 文件,屏幕阅读器 NVDA(在我的例子中)识别它并读取“...图形替代描述”。但是,可访问性检查器PAC 2显示错误:“未标记图像对象”。

你能提供一些关于这个主题的解释或/和代码示例吗?

0 投票
2 回答
291 浏览

pdf - 带标签的 PDF 文件可以有演示表吗?

在 HTML 中,我可以有<table role=presentation>这表明该表不是真正的表,仅用于布局目的。这有助于屏幕阅读器导航到真实表格。

标记的 PDF 中的表格是否有类似的结构?

据我所知,<table>PDF 中的标签意味着它是一个真实的表格。我找不到任何表明其他情况的属性。

0 投票
1 回答
1132 浏览

itext - 使用 iText 创建可访问的 PDF 文件

最近我下载了 iText 的试用许可证。我试图实现以下目标:

  • 从 WORD、PP、Excel 等创建 PDF 文档。
  • 处理现有的 PDF 文件。
  • (最重要的)- 必须根据 WCAG 502 要求(PDF/UA)创建/转换为完全可访问的文件以供禁用

我尝试了以下代码:(C#)

但是,在 Acrobat Reader 检查后,输出文件标记为“未标记”PDF 文件。

请告知我应该如何使用 iText 来实现我的目标。

0 投票
1 回答
1050 浏览

c# - 使用 iTextSharp 以编程方式标记未标记的 pdf

我想用 iTextSharp 解析 PDF 文件。对于带标签的 PDF,我使用了 TaggedPdfReaderTool 和 .ConvertToXml() 方法,该方法返回了可接受的 XML 以供进一步解析。现在我必须解析我需要解析的未标记 PDF!在 Adob​​e Acrobat 中,您可以使用其辅助工具将标签添加到 PDF。之后,我可以用 iTextSharp 解析它。现在我正在寻找一种免费的解决方案,以编程方式(使用 iTextSharp)向我的 PDF 添加标签。在“iText in Action”一书中,我读到您可以创建一个带标签的 PDF(从 XML 文件),但我需要转换一个现有的!

我用于解析标记 PDF 的代码:

0 投票
1 回答
769 浏览

jasper-reports - 如何从 Jaspersoft / JRXML 生成双语标记 PDF 输出?

我们使用 Jaspersoft iReport Designer 创建双语 PDF 输出——每个文件都包含英语和法语文本。

出于可访问性的原因,我们希望在生成的 PDF 中用适当的语言标记每个文本块。请参阅PDF19:使用 PDF 文档中的 Lang 条目指定段落或短语的语言,了解我们正在尝试做的事情。

手动修改 PDF 文件不是一种选择,因为我们直接通过电子邮件将它们发送给我们的用户。

Jaspersoft 支持这个吗?

0 投票
0 回答
102 浏览

pdf - 如何将标签添加到现有的 pdf 文件中?

谁能解释如何使用java中的iText库将标签添加到现有的pdf文件中,是否有任何示例代码可以将标签添加到pdf文件中?

0 投票
0 回答
1030 浏览

java - 如何使用 pdfbox java 修复链接可访问性的标记注释失败/错误?

使用 adobe 找到了解决方案 - https://answers.acrobatusers.com/How-I-fix-Tagged-Annotations-fail-error-accessibility-links-q228128.aspx

如何使用 pdfbox 添加 Link-OBJR(链接注释的对象引用)。

使用上面的代码标记-

使用上面的代码标记

标记文档参考- https://drive.google.com/file/d/1n_T361G6LTNLycQbw-3gP2nmBV-oTJdR/view?usp=sharing

寻找以下结构

寻找这样的结构

0 投票
1 回答
407 浏览

java - 即使没有与PDFBox中的布局相关的属性(文档目录结构中的/ A),也获取标签的相关BBox?

当他们在结构根中选择标签时,我想突出显示特定标签的 bbox。出于这个原因,当标签包含这样的属性时,我能够获得 bbox

结构体.

但是我在一些 pdf 中发现,即使没有 (/A) 之类的属性,当您选择特定标签时,Adobe dc 也可以突出显示内容(bbox)。在这种情况下如何获得 bbox?我试图获取与 bbox 相关的属性的代码是

pdf 链接是https://drive.google.com/file/d/1_-tuWuReaTvrDsqQwldTnPYrMHSpXIWp/view?usp=sharing

请任何人帮助我......

0 投票
2 回答
150 浏览

testing - 如何测试 LibreOffice Writer 的可访问 PDF 输出?

LibreOffice Writer 可以导出为 Tagged PDF。我应该如何测试结果文档的可访问性?可能是检查已添加的标签以检查它们是否反映了预期的文档结构,或者可能模拟用户通过辅助软件使用文档的体验?

我知道 Adob​​e Acrobat Pro 具有相关功能,但我正在寻找使用免费/自由/开源软件的解决方案。

0 投票
0 回答
61 浏览

pdf - 从标记的 pdf 操作标记树

问: 我正在研究 iText7 的可访问性标签,我想操纵标签树的结构。

任务是这样的。 首先,从树中提取标签树。然后,将节点移动到它的父节点。

演示结构是这样的。

是否可以使用一些库来实现我的目标?据我了解,iText 中的tagUtils可能会有所帮助。我已经尝试在 pdf 规范下使用 iText 解析标记的 pdf。然而,它非常不直观。由于众所周知的 pdf 工具,Acrobat 可以在面板上显示标签以使 pdf 易于访问。必须是一些库才能从 tagged-pdf 中毫无痛苦地提取标签树。

在此处输入图像描述 伊姆古尔

任何回应都会非常有帮助。谢谢。