是否可以以编程方式确定 PDF 是否被“标记”(为了便于访问)?我正在使用 PHP,并且希望(如果可能)简单地读取 PDF 文件,如果标记则返回 true,否则返回 false。
问问题
1338 次
2 回答
5
在官方 ISO PDF-1.7 规范中(在 Adobe 网站上免费提供的副本中),我在第 574 页读到:
“标记的 PDF 文档还应包含标记信息字典(参见表 321),标记条目的值为true。”
对我来说这意味着...
- ...您必须解析 PDF 结构和
- ...查找文档目录
- ...应该有一个MarkInfo条目的地方
- ...指定标记信息字典
- ...它应该包含一个名为Marked的键,对于标记的 PDF ,其布尔值为true 。
于 2012-05-27T16:42:51.800 回答
3
也许您可以更进一步(检查所有PDF_get_xx函数)。您还需要此作为参考。
基于此:
Characteristics of a properly tagged PDF:
- The PDF file includes a logical reading order for its content
- Images are given correct alternate descriptions
- Tables are correctly tagged to represent the table structure
- Form-fields are authored to promote their utility to screen-readers
- Represents text as Unicode to clear up composition irregularities such as soft
and hard hyphens
你可能会走得更远。
于 2012-05-27T16:43:53.663 回答