1

我必须开始一个新项目来管理工作流实验室生成的数据。生成的数据是分层的,包含结构化和非结构化数据。大部分数据将是办公文件和图像。需要查询office和pdf文件的内容。

我首先开始学习 CMIS 1.1。但我找不到它的任何实现。Alfresco 似乎是最好的,但尚未实施 CMIS 1.1。

ModeShape 看起来不错。但我不知道它是否足够受欢迎。我担心 JBoss 会像他们对 Seam 2 所做的那样放弃它。

RDBMS 不太适合管理和查询文件。

那么,这种类型的项目应该选择什么技术呢?

我在 javaEE + RDBMS 开发方面有很好的经验。

谢谢

4

3 回答 3

3

通常,文档管理系统将成为此解决方案的绝佳选择。

根据您计划在项目上花费的工作量,您可能想要探索 Alfresco 的架构并利用支持Alfresco Share Web 应用程序的底层Spring MVC 框架。

Alfresco 论坛上的这篇文章来看,Alfresco 符合 CMIS 1.1。您应该能够通过以下 URL 从 Alfresco 访问 CMIS 1.1:http ://example.com:8080/alfresco/api/-default-/public/cmis/versions/1.1/atom

有关 Alfresco CMIS 的更多信息:http ://www.alfresco.com/cmis

于 2014-02-17T23:15:50.207 回答
2

我建议使用Apache Jackarabbit,它是 Java Content Repository 规范 (JSR-170) 的参考实现。
它支持版本控制、搜索、事务,是依赖结构化分层数据的内容驱动应用程序的合适框架。
您还可以查看Apache Sling,这是一个基于 Apache Jackarabbit 构建 Web 应用程序的框架。

BR。

于 2014-02-18T09:09:36.233 回答
1

实际上,RDBMS 是一个非常好的二进制数据解决方案,例如 Oracle DBF http://docs.oracle.com/cd/E11882_01/appdev.112/e18294/adlob_fs.htm#ADLOB45990它提供了开箱即用的 plsql 内容存储 API。CMIS 协议类似于 JCR API 概念,但 JCR 不是实现 CMIS 所必需的。我们通常将元数据存储在 RDBMS 上,将二进制文件存储在原始文件系统上,因为好的 RDBMS 实现成本太高。如果许可成本对您的项目来说不是问题,那么好的 RDBMS 也应该适用于二进制数据。有关 CMIS,请参阅 Apache Chemistry http://chemistry.apache.org/project/cmis.html,我使用修改后的 Fileshare 存储库实现。

于 2014-02-17T11:52:55.753 回答