0

我正在寻找一些读取.pdf文件的方法,但我无法从中获得任何东西,我可能需要一个库,但我发现的所有选项都非常混乱且难以处理。

我想知道哪种方式对我来说是完成这项任务的最佳方式,即搜索.pdf并获取摘要部分中的内容。(这是文本)

4

1 回答 1

2

最简单和最便宜的是使用其他程序员都知道的流行的开源库。

在尝试从头开始编写自己的 PDF 阅读器之前,请查看以下内容:

解析:

  • 波多佛

    PoDoFo 库是一个免费的、可移植的 C++ 库,其中包括用于解析 PDF 文件并将其内容修改到内存中的类。更改可以轻松写回磁盘。解析器还可用于从 PDF 文件中提取信息(例如,解析器可用于 PDF 查看器)。除了解析 PoDoFo 还包括非常简单的类来创建您自己的 PDF 文件。所有类都记录在案,因此很容易开始使用 PoDoFo 编写自己的应用程序。

生成:

  • 自由哈鲁

    Haru 是一个免费的、跨平台的、开源的软件库,用于生成用 ANSI-C 编写的 PDF。它可以用作静态库(.a、.lib)和共享库(.so、.dll)。

  • 熊猫

    用 C 编写的 PDF 生成 API

于 2013-03-12T19:04:12.780 回答