java - 使用 Apache Jackrabbit 提取元数据

Question

我稍微使用了 Alfresco，Apache Tika 之上有一个薄抽象层，用于从文档中提取元数据。

我决定只使用 Jackrabbit，因为我不需要如此强大的解决方案。但除了 jackrabbit-text-extractors 模块之外，我看不到对文档元数据（都柏林核心属性）的任何其他支持。

更多关于 jackrabbit-text-extractors maven artifact version 2.0-SNAPSHOT 似乎不在 SVN 主干中。

有人可以告诉我选择什么方法吗？

score 1 · Accepted Answer

我的理解是jackrabbit现在使用tika进行文本提取

1 回答 1