0

我正在使用文件编写一个 c++ 程序,我需要从现有文件(如 doc 文件和 pdf 文件)中获取输入。如何用 C++ 编程?在获得输入后,我如何将这些详细信息写入新的 doc 或 pdf 文件?任何人都可以用一个例子来解释我吗?

4

2 回答 2

3

C++ 作为一门语言不具备“写入 DOC 文件”或“从 PDF 文件读取”等功能。作为程序员,唯一可用的工作人员是原始的逐字节读取或写入。要使您的新品牌文件与 PDF/DOC/etc 兼容,您必须符合所选的文件格式。阅读也是如此 - 您应该了解原始字节数组的哪些部分负责什么。

通常,此任务称为“解析”或“序列化”。将现有解析器之一用于特定文件格式而不是重新发明轮子是个好主意。此外,某些文件格式可能正在申请专利,因此您可能无法在未购买许可证的情况下处理它。

到目前为止的一些线索:

于 2013-11-11T15:52:12.620 回答
0

There are some libraries available on the web now(the question is from 2013, maybe that time there weren't many).

Apart from the links in selected answer, you can try PDFTron. It also supports new features, eg. Linearization.

Here is one of their samples is -> https://www.pdftron.com/documentation/samples/cpp/TextExtractTest

(That program itself contains 4 if blocks, with slightly different features of the library/SDK, to try)

There should be more, search on the web for PDF parsing libraries.

于 2020-07-18T09:44:43.153 回答