0

我需要你的帮助,我想到了一个主意。

我有一堆 PDF 文件,这些文件是我大学里的测试。我想创建一个新的 PDF 文件,其中包含每个 PDF 中的一个练习(如果可能的话,使用过滤词来确定要选择的练习)。

问题是我希望这个过程自动化。也就是说,通过单击一个按钮,来自不同 PDF 文件的一堆练习将被过滤成一个新的 PDF 文件,并将保存在磁盘的某个位置。

以下是关于这个想法的问题:

  1. 有没有免费软件可以做到这一点?

  2. 如果我想自己实现它,我该如何创建一个数据库,让我可以保存和提取具有原始外观(边距等)的 PDF 内容。

非常感谢!

4

1 回答 1

0

您可以使用 iTextSharp 或 PdfSharp 来实施解决方案,假设每个练习都从新页面开始。
循环浏览文档的页面并在当前页面中搜索单词“Exercise”。如果找到该单词,则创建一个新的空文档,从源文件中提取该页面并将其插入到新文档中。搜索下一页,如果找到“练习”一词,则保存上一个文档并创建一个新文档。如果找不到该单词,请提取页面并插入您已创建的文档中。
通过这种方式,您可以实现任何您想要的过滤。

于 2013-07-12T16:37:14.670 回答