0

我们必须导出露天数据并导入另一个存储库,而不一定是备份/恢复过程。我们的目标是开发可以在某些条件下运行并提取数据的脚本,一组文件及其所有元数据。

我有下面的链接,它谈到了相同的内容,但它是旧的,并且不能像文件版本,基于条件的提取一样完成。

https://www.ibm.com/developerworks/cn/xml/x-cmis2/index.html

我想知道任何可用于将 alfresco 数据提取和导入到其他存储库的方法。

4

1 回答 1

3

没有开箱即用的东西可以做到这一点。复制子系统不适合多于少数节点的频繁复制。

因此,您将不得不编写自定义解决方案或查看可以执行此操作的第三方解决方案。Simflofy就是一个例子。另一个例子是Parashift Alfstream模块。

如果您想自己开发,我建议您执行以下操作:

  1. 编写代码以将一个或多个文件导出到文件系统。这应该是在源存储库和所有目标存储库之间共享的存储。
  2. 在每个文件旁边,编写一个描述文件元数据的“清单”文件,包括自定义属性和属性值。您应该使用批量文件系统导入工具在进行导入时所期望的相同格式。
  3. 向队列添加一条消息,描述导出数据的位置以及需要导入的位置。
  4. 在目标存储库中,编写一个订阅队列的侦听器。
  5. 当侦听器收到消息时,它可以在目标系统中启动批量文件系统导入。BFSIT 将导入文件并按照您在步骤 2 中生成的清单文件中的说明设置元数据。
  6. 可选地,目标系统可以在队列上放置另一条消息,确认已执行导入,然后源存储库可以拾取该消息以完成任务。

有些人已经成功地为此使用了 Apache Camel,但这并不是绝对必要的。

于 2017-11-07T20:38:30.637 回答