市场上有许多转换器可用于从简单的 HTML/CSS 页面创建和操作 PDF 文件。这些工具非常方便快速创建一些漂亮的 PDF 文件,而无需使用世界上更复杂的报告工具。
我正在使用 Winnovative 软件来实现这一目标,但我想知道如何创建可访问的文件(标记的 PDF)以改进文本到语音工具的处理。
是否存在任何 HTML 标签来实现这一点?有人对这种要求有一些经验吗?
市场上有许多转换器可用于从简单的 HTML/CSS 页面创建和操作 PDF 文件。这些工具非常方便快速创建一些漂亮的 PDF 文件,而无需使用世界上更复杂的报告工具。
我正在使用 Winnovative 软件来实现这一目标,但我想知道如何创建可访问的文件(标记的 PDF)以改进文本到语音工具的处理。
是否存在任何 HTML 标签来实现这一点?有人对这种要求有一些经验吗?
该工具本身必须能够支持 pdf/ua 规范(标记为 pdf)。可能的 PDF 标签列表很好地对应于 html 标签。例如,有<h1>
直通<h6>
标签、表格标签(<table>, <th>, <tr>, <td>
)、列表标签(<l>, <li>
)等。
有一些细微的区别,例如开始列表的标记是<l>
而不是 html<ul>
或<ol>
. 对于 PDF 文档,屏幕阅读器会说“包含 3 个项目的列表”,然后您浏览每个项目。它似乎并不关心它是否带有项目符号或编号,因此 pdf/ua 具有<l>
和 html 具有<ol>
和<ul>
.
无论如何,关键是您不需要使用任何特殊的 html 标签来生成带标签的 pdf。生成pdf的工具只需要支持pdf/ua即可。我在 Winnovative 的网站上没有看到任何表明它支持它的东西。
仅供参考,这里是 PDF/UA 中可用的标签
<Art>
<Annot>
<BibEntry>
<BlockQuote>
<Caption>
<Code>
<Div>
<Document>
<Figure>
<Form>
<Formula>
<H>
<H1>
<H2>
<H3>
<H4>
<H5>
<H6>
<Index>
<Lbl>
<Link>
<L>
<LI>
<Lbody>
<Note>
<P>
<Part>
<Quote>
<Reference>
<Sect>
<Span>
<Table>
<TD>
<TH>
<TOC>
<TOCI>
<TR>
当使用 Internet Explorer MSHTML 引擎从 HTML 转换为 PDF 时,Essential PDF支持生成带标签的 PDF。
注意:我为 Syncfusion 工作。
slugolicious 中关于标记 PDF 的答案很好的解释。在为一个项目研究可访问的 PDF 输出时,我发现 PDFReactor (www.pdfreactor.com) 可以做到这一点。不幸的是,这个项目现在没有许可证的预算,所以我还没有在生产中测试它,但尝试了免费的个人版本,结果令人满意。