我想提取 PDF 文件的文本和属性(作者、标题等)。
我需要在经典的 ASP 环境中从 pdf 文件中提取和解析文本。我阅读了另一篇关于使用随 Adobe Acrobat 9 安装的 PDF iFilter 驱动程序的文章,该驱动程序可以通过 COM 引用。
这可能吗?如果是这样,我该如何开始?
我想提取 PDF 文件的文本和属性(作者、标题等)。
我需要在经典的 ASP 环境中从 pdf 文件中提取和解析文本。我阅读了另一篇关于使用随 Adobe Acrobat 9 安装的 PDF iFilter 驱动程序的文章,该驱动程序可以通过 COM 引用。
这可能吗?如果是这样,我该如何开始?
如果您知道 COM 类名或 clsid,您应该能够使用 Server.CreateObject() 来获取实例。然后,您应该能够在其上调用IFilter 方法。