我想解析 pdf 文件,以便我可以识别每篇文章的标题及其描述。以便我可以将标题文本和描述文本存储在缓存中以供搜索。是否有任何库或工具可以做到这一点?
问问题
836 次
1 回答
1
首先您可以安装Adobe Pdf IFilter dll。然后,您可以使用此库(在 C# 中使用 IFilter)从任何 .pdf 文件中读取属性。或者,您也可以查看此库(实现 TextReader 以使用 IFilter 提取各种文件内容)。
于 2009-06-29T13:30:53.247 回答