c# - 解析pdf文件

Question

我需要根据文件的内容将大型 pdf 文档拆分为较小的文件。我们使用 BCL easyPDF 来操作 pdf 文件。easyPDF可以根据页码拆分pdf文档，但不能根据文件内容拆分文档。它也没有搜索功能（据我所知，如果我错了，请有人告诉我。）来确定内容的位置。

现在有人可以告诉我如何使用 .net 在 pdf 文件中找到文本的位置吗？

谢谢

score 3 · Accepted Answer

您可以尝试Docotic.Pdf 库来完成您的任务。

或者，您可以从 PDF 中检索带有边界矩形的单词集合。这应该可以帮助您找到文件中文本的位置。

免责声明：我为图书馆的供应商工作。

score 2 · Accepted Answer

2

您需要 .NET 中的 PDF 库，例如 iText.Net。

于 2012-05-03T18:23:55.537 回答

score 1 · Accepted Answer

看看这个问题。有一些可以满足您要求的库的链接

3 回答 3