1

我正在启动一个具有 NLP、语义数据存储、内容管理等要求的项目,而 Apache Stanbol 似乎很合适,但我不确定它是否已经准备好,所以我试图在之前进行适当的评估开始使用它,因为我担心的事情很少:

  1. Stanbol 似乎有点年轻和不成熟(最新版本 0.12)。是否有人在商业项目/应用程序/设置中使用过它(我未能在线找到此信息)?这些项目的规模是多少?

  2. Stanbol 的水平可扩展性如何?它的云/集群功能是什么?据我所知,它依赖于 Apache Jena 进行存储,而 Jena 存储不能水平扩展,这会使 Stanbol 也无法水平扩展。我可能对此有误,但这是我目前的理解,如果我错了,请纠正我。也许 Jena 可以与其他东西交换以用作 RDF 存储提供程序,而我不知道吗?

  3. Stanbol 的学习资源似乎有点稀缺。有谁知道一个地方/书/任何我可以在引擎盖下对 Stanbol 有更多了解的地方(除了 Stanbol 官方网站和 IKS 网站)?有什么好的选择吗?我知道关于 NLP 有很多不错的选择(例如 GATE、UIMA),但它们缺乏 CMS 功能。

谢谢。

4

2 回答 2

2

对于你的问题:

  • 1)我一直在从事一个涉及 Stanbol(版本 0.10)的项目。它仍处于预生产阶段。对于 CMS,我们评估了 JackRabbit 和 Alfresco。在我们的案例中,我们发现 Alfresco (CMIS) 是一个更好的选择。我喜欢 stanbol 的是默认提供的增强链和 增强引擎集 。这是一个中小型项目。
  • 3) 我发现这本书(Instant Apache Stanbol,Packt Publishing)在我的工作中非常实用和有用,尤其是关于实体中心和增强引擎的部分。
于 2014-05-15T04:33:34.200 回答
2

一个可行的选择是使用Redlink ,它在后端使用Apache StanbolApache Marmotta在云中提供内容分析和链接数据服务

Readlink团队曾在IKSApache Stanbol上工作过;由于这些原因,在决定在生产环境中使用这些技术时,与他们联系可能是一个很好的起点。

于 2014-11-12T11:07:07.157 回答