我正在寻找一些读取.pdf
文件的方法,但我无法从中获得任何东西,我可能需要一个库,但我发现的所有选项都非常混乱且难以处理。
我想知道哪种方式对我来说是完成这项任务的最佳方式,即搜索.pdf
并获取摘要部分中的内容。(这是文本)
最简单和最便宜的是使用其他程序员都知道的流行的开源库。
在尝试从头开始编写自己的 PDF 阅读器之前,请查看以下内容:
解析:
PoDoFo 库是一个免费的、可移植的 C++ 库,其中包括用于解析 PDF 文件并将其内容修改到内存中的类。更改可以轻松写回磁盘。解析器还可用于从 PDF 文件中提取信息(例如,解析器可用于 PDF 查看器)。除了解析 PoDoFo 还包括非常简单的类来创建您自己的 PDF 文件。所有类都记录在案,因此很容易开始使用 PoDoFo 编写自己的应用程序。