我需要根据文件的内容将大型 pdf 文档拆分为较小的文件。我们使用 BCL easyPDF 来操作 pdf 文件。easyPDF可以根据页码拆分pdf文档,但不能根据文件内容拆分文档。它也没有搜索功能(据我所知,如果我错了,请有人告诉我。)来确定内容的位置。
现在有人可以告诉我如何使用 .net 在 pdf 文件中找到文本的位置吗?
谢谢
我需要根据文件的内容将大型 pdf 文档拆分为较小的文件。我们使用 BCL easyPDF 来操作 pdf 文件。easyPDF可以根据页码拆分pdf文档,但不能根据文件内容拆分文档。它也没有搜索功能(据我所知,如果我错了,请有人告诉我。)来确定内容的位置。
现在有人可以告诉我如何使用 .net 在 pdf 文件中找到文本的位置吗?
谢谢
您可以尝试Docotic.Pdf 库来完成您的任务。
该库可以从 PDF 中提取文本(带或不带格式)。
或者,您可以从 PDF 中检索带有边界矩形的单词集合。这应该可以帮助您找到文件中文本的位置。
免责声明:我为图书馆的供应商工作。
您需要 .NET 中的 PDF 库,例如 iText.Net。
看看这个问题。有一些可以满足您要求的库的链接