问题标签 [jackrabbit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
794 浏览

java - 使用 Apache Jackrabbit 提取元数据

我稍微使用了 Alfresco,Apache Tika 之上有一个薄抽象层,用于从文档中提取元数据。

我决定只使用 Jackrabbit,因为我不需要如此强大的解决方案。但除了 jackrabbit-text-extractors 模块之外,我看不到对文档元数据(都柏林核心属性)的任何其他支持。

更多关于 jackrabbit-text-extractors maven artifact version 2.0-SNAPSHOT 似乎不在 SVN 主干中。

有人可以告诉我选择什么方法吗?

0 投票
3 回答
11886 浏览

java - 将元数据存储到 Jackrabbit 存储库中

任何人都可以向我解释,如何在以下情况下进行?

  1. 接收文件(MS docs、ODS、PDF)

  2. 通过 Apache Tika 提取 Dublic 核心元数据 + 通过 jackrabbit-content-extractors 提取内容

  3. 使用 Jackrabbit 将文档(内容)与其元数据一起存储到存储库中

  4. 检索文档 + 元数据

我对第 3 点和第 4 点感兴趣...

详细信息:应用程序正在交互处理文档(一些分析 - 语言检测、字数统计等 + 收集尽可能多的细节 - 都柏林核心 + 解析内容/事件处理),以便将处理结果返回给用户,然后提取的内容和元数据(提取的和自定义的用户元数据)存储到 JCR 存储库中

感谢任何帮助,谢谢

0 投票
1 回答
2222 浏览

java - 将各种类型的文档(ods、ms office、pdf)保存到 Jackrabbit 存储库中

我不确定选择哪种方法来存储这些类型的文档,因为关键要求是收集尽可能多的元数据,而 pdf、ods 和 MS Office 文档具有各种类型的元数据......

因此,如果节点树具有“组/用户/类别/文档”或“类别/组/用户/文档”结构(我不确定哪个更好),每个文档都必须有一个属性“ type”如果它是 pdf/doc/odt/ppt 等,我每次都必须对此进行测试,以了解它具有哪些元数据类型,对吗?在我看来非常无效。。

0 投票
1 回答
1347 浏览

jackrabbit - Jackrabbit Sql2-Query -> DescendantNodeJoinCondition

首先我看不到我的代码示例!-> 点击 {} 并在我的代码中归档!

我想获取照片节点的信息,例如标题是 Title: 4.jpg 我有以下查询:

我的结果集是空的。它应该充满我的匹配节点!

怎么了?

问候

0 投票
1 回答
1563 浏览

jackrabbit - JackRabbit - 删除重复行

我在jackrabbit-users list 上问过这个问题,但没有得到答案。

JCR-SQL2 不提供 SELECT DISTINCT(或类似的 AFAIK)。JCR 1.0 中的 SQL 或 XPATH 也不...人们如何解决这个问题?删除重复行的最佳方法是什么?

我读到有人正在迭代结果并将它们放入一个集合中。就我而言,由于可能产生大量结果,这种方法最终可能成本太高。

这里有人有建议吗?

0 投票
4 回答
4248 浏览

java - 用于比较的 Jackrabbit 日期格式

我正在使用 Jackrabbit 来存储我的文档。现在我想搜索使用 XPATH 在特定日期之后创建的文档。为此,我尝试了类似的方法:

date 是类java.util.Date
dateString 的对象,格式为:Wed Mar 16 00:00:00 CET 2011

但这给了我一个InvalidQueryException,表明 dateString 是错误的:

无效查询:第 1 行第 136 列的词法错误。遇到:“0”(48),之后:“:”for 语句

所以问题是: xs:dateTime 的正确日期格式是什么?

提前致谢

0 投票
1 回答
1134 浏览

java - JackRabbit 持久性管理器澄清

我正在尝试决定为我的项目使用哪种类型的持久性管理器。我读了这个关于 persistenceManagers 的 wiki 条目

首先,由于 JCR-2802(所有非捆绑 PM 已弃用),只有

并且所有这些 InMem、Object、Xml PersistenceManager 都已弃用。(不推荐使用 InMemPM 时,MemoryFileSystem 仍然可以吗?)

因此,正如我所看到的,BundleFsPersistenceManager 在文件系统上使用 LocalFileSystem 来持久化文件(是否有解释如何将内容存储到文件中的方式的 wiki 条目? - 就像不同类型的节点属性,例如 nt:file)和 BundleDbPersistenceManager 使用 DbFileSystem将完全相同的文件存储到 DBMS 中?否则无法进行 lucene 索引和全文搜索,对吗?

所以原因是系统的集群和分布式特性以及原子性......否则数据库实现将是多余的,对吗?这样人们就有了更多的选择。

0 投票
2 回答
410 浏览

java - Apache JackRabbit 存储库是否有任何抽象层?

我想知道是否有一个库可以为开发人员提供某种抽象,以便更轻松地访问 JackRabbit。

我知道有一些 CMS 使用 jackRabbit 并且具有这样的抽象。

可以涵盖所有这些的东西:

例子 :

我将自己实现这一层,但我想确定,我不会“实现已经实现的轮子”。

0 投票
0 回答
754 浏览

java - jackrabbit 对象内容映射和 org.springmodules.jcr 死了吗?

我想知道这个。我计划在一个 ECM 项目中使用 jackrabbit ,似乎OCM正在消亡之类的,它与项目的其余部分不同。在 maven repos 中有旧jackrabbit-ocm-nodemanagement jackrabbit-ocm版本,否则项目本身可以通过参考文档中的参考 zip 存档下载。

org.springmodules.jcr 没有进入官方的 spring 源代码库。它被遗弃了。尽管它是jackrabbit OCM 的一个很好的粘合剂,而且这个项目看起来很棒。我绝对不明白他们为什么决定留下如此重要的规范!?!?!?

它目前作为某种保护存在于此。还有一个jcr 弹簧扩展,与我想的一样。它有它的Jira 部分,但对我来说一切似乎都被抛弃了。如果我遇到了一些讨厌的错误,任何支持都不会得到我。

如果你有比我更聪明的信息,请告诉我。

0 投票
2 回答
1123 浏览

java - openCMIS 本地绑定 - 带有 jackRabbit 实现的 JcrServiceFactory

嘿,第三种选择有问题,因为循环在JcrServiceFactory搜索以 jcr.* 开头的属性(其他没有传递),但在RepositoryFactoryImpl(Jackrabbit impl) 之后搜索“org.apache.jackrabbit .repository.home”在传递的属性集合中......这没有意义。即使 org.apache.jackrabbit.repository.home 在那里,它也不会开始,PREFIX_JCR_CONFIG所以它不会被放入jcrConfig集合中去RepositoryFactoryImpl.getRepository()

Map<String, String> map = null;如果因为存在if (parameters == null)条件,那将是有道理的RepositoryFactoryImpl,但这并不

它发生在init方法中

JcrServiceFactory.java



但是这里的参数 Map 是空的 {} 并且它返回 null; 因为它正在搜索 RepositoryFactoryImpl.REPOSITORY_HOME,即 org.apache.jackrabbit.repository.home

RepositoryFactoryImpl.java