0

我想将项目中嵌入的 PDF 文件的文本复制到NSString. 我尝试了 Zachron 的 pdfiphone,但它似乎不适用于 armv7。我需要它在 armv7 上工作。

我已经阅读了一些 Quartz 框架指南,但我仍然不知道如何使用 Quartz 获取 PDF 的文本。如果您知道解决方案,无论是否使用 Quartz,请写下来。

4

1 回答 1

0

如果您的目标 PDF 不是用 CJK(中文、日文和韩文)编写的,那么您的方法更简单。

  1. 下载 PDFKitten。它有一个示例 PDF 解析器。
  2. 将 PDFKitten 的 PDFCore 部分集成到您的项目中。请注意 PDFKitten 是 pre ARC 代码。因此,您必须将 -fno-objc-arc 设置为所有 PDFKitten 文件。
  3. 在 PDF 中,打印文本运算符是 TJ 和 Tj。
  4. 所以你必须修改 TJ 和 Tj 的回调函数。

如果您必须处理 CJK PDF 文件,您的方式会更复杂。因为很多 CJK PDF 文件都有 CID 编码。CID 表示字形的字符识别。PDFKitten 不包括此类处理。您必须将 CID 添加到 UCS2 转换功能。

于 2013-07-23T13:35:15.360 回答