1

我稍微使用了 Alfresco,Apache Tika 之上有一个薄抽象层,用于从文档中提取元数据。

我决定只使用 Jackrabbit,因为我不需要如此强大的解决方案。但除了 jackrabbit-text-extractors 模块之外,我看不到对文档元数据(都柏林核心属性)的任何其他支持。

更多关于 jackrabbit-text-extractors maven artifact version 2.0-SNAPSHOT 似乎不在 SVN 主干中。

有人可以告诉我选择什么方法吗?

4

1 回答 1

1

我的理解是jackrabbit现在使用tika进行文本提取

https://issues.apache.org/jira/browse/JCR-1878

于 2011-02-28T23:50:16.573 回答