1

我有数十万个 PDF,目前存储在文件系统中。我有一个自定义应用程序,作为对其实际目的的事后考虑,它提供了对这些 PDF 的访问。我想从自定义应用程序中取出“存储和检索”部分,并使用开源文档存储后端。

应该通过 REST API 访问 PDF 商店,这样用户就不需要自定义客户端来进行基本的文档浏览和查看。存储 PDF 的程序也应该能够通过 REST API 工作。他们将提供实际的二进制或 ASCII 数据以及结构化元数据,这些元数据以后可用于检索。

一个典型的检索查询是“给我所有在 X 天和 Y 天之间创建的文档类型为 A 或 B 的文档”。

我的研究,是否存在这样的存储后端,结果是空的。你们中有人知道提供这些功能的系统吗?考虑了开源首选、价格合理的系统。

我不是在寻找关于如何使用可用技术“自己动手”的建议。相反,我试图找出是否可以避免这种情况。提前谢谢了。

4

1 回答 1

1

您所描述的听起来像是一个文档管理或资产管理系统,其中有很多;许多人使用 PDF 文件。我对 Xinet(http://www.northplains.com/xinet - 现在显然已收购)或 Elvis (http://www.elvisdam.com) 等商业产品有一些短暂的经验。两者都可能符合您的要求,但它们可能太大而且可能太贵。

你看过Alfresco吗?这是我多年前在担任遴选委员会董事会时接触到的开源替代方案。据我记得,它肯定会朝着您正在寻找的方向发展,并且它是开源的,因此也可能适合这个角度:http ://www.alfresco.com 。

于 2012-12-04T23:43:39.910 回答