10

我需要根据文件的内容将大型 pdf 文档拆分为较小的文件。我们使用 BCL easyPDF 来操作 pdf 文件。easyPDF可以根据页码拆分pdf文档,但不能根据文件内容拆分文档。它也没有搜索功能(据我所知,如果我错了,请有人告诉我。)来确定内容的位置。

现在有人可以告诉我如何使用 .net 在 pdf 文件中找到文本的位置吗?

谢谢

4

3 回答 3

3

您可以尝试Docotic.Pdf 库来完成您的任务。

该库可以从 PDF 中提取文本(带或不带格式)

或者,您可以从 PDF 中检索带有边界矩形的单词集合。这应该可以帮助您找到文件中文本的位置。

免责声明:我为图书馆的供应商工作。

于 2012-05-04T15:45:18.457 回答
2

您需要 .NET 中的 PDF 库,例如 iText.Net。

于 2012-05-03T18:23:55.537 回答
1

看看这个问题。有一些可以满足您要求的库的链接

如何在 C# 中以编程方式搜索 PDF 文档

于 2012-05-03T18:22:40.077 回答