我目前正在尝试解析 PDF 文件的语义结构。我相信添加元数据以使 PDF 可访问是正确的方法,但我找不到可以干净处理它的库。
我已经在 iOS 上尝试过 PDFLib TET,但我无法让它打开某些测试文档,而且它返回的错误太晦涩难懂,无法在 Google 上搜索。
有没有其他图书馆做同样的事情?
我目前正在尝试解析 PDF 文件的语义结构。我相信添加元数据以使 PDF 可访问是正确的方法,但我找不到可以干净处理它的库。
我已经在 iOS 上尝试过 PDFLib TET,但我无法让它打开某些测试文档,而且它返回的错误太晦涩难懂,无法在 Google 上搜索。
有没有其他图书馆做同样的事情?
我会看看 pCOS-Library(也来自http://pdflib.com)。要在 PHP 中使用,您可以查看http://www.setasign.com/的替代方案。他们可能有为此目的的工具。