5

是否可以以编程方式确定 PDF 是否被“标记”(为了便于访问)?我正在使用 PHP,并且希望(如果可能)简单地读取 PDF 文件,如果标记则返回 true,否则返回 false。

我看过FPDFTCPDF,但我不清楚是否可以提取这些信息。

4

2 回答 2

5

在官方 ISO PDF-1.7 规范中(在 Adob​​e 网站上免费提供的副本中),我在第 574 页读到:

“标记的 PDF 文档还应包含标记信息字典(参见表 321),标记条目的值为true

对我来说这意味着...

  1. ...您必须解析 PDF 结构和
  2. ...查找文档目录
  3. ...应该有一个MarkInfo条目的地方
  4. ...指定标记信息字典
  5. ...它应该包含一个名为Marked的键,对于标记的 PDF ,其布尔值为true 。
于 2012-05-27T16:42:51.800 回答
3

也许您可以更进一步(检查所有PDF_get_xx函数)。您还需要作为参考。

基于此:

Characteristics of a properly tagged PDF:

    - The PDF file includes a logical reading order for its content
    - Images are given correct alternate descriptions
    - Tables are correctly tagged to represent the table structure
    - Form-fields are authored to promote their utility to screen-readers
    - Represents text as Unicode to clear up composition irregularities such as soft
      and hard hyphens

你可能会走得更远。

于 2012-05-27T16:43:53.663 回答