“mlcp”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

406 浏览

javascript - marklogic mlcp 自定义转换将聚合文档拆分为多个文件

我有一个 JSON“聚合”文件，我想使用 mlcp 将其拆分并作为多个文档摄取到 MarkLogic 中。

我想在摄取期间使用 javascript 转换内容。

我的 JSON 文件如下所示：

...并且我想通过 MLCP 运行此文件，以便每个文档都包含数组中的一个项目。

即一个文档将包含 {blobA}，另一个将包含 {blobB}，另一个将包含 {blobC}....等等。

如何编写我的自定义 .sjs 转换模块？

2016-04-08T18:06:38.853

0 投票

2 回答

671 浏览

xquery - 使用 mlcp、csv 文件导入数据并转换解析日期

我有一个 csv 文件。我已经使用 mlcp 管理将这些数据导入 MarkLogic，然后在 MarkLogic 中创建了一个 xml 文件。

现在在 csv 中，我在其中一列中随机使用了这种格式“6/29/2013 5:00:00 PM”。如何使用 xquery 和可能的节点替换作为转换函数将此日期转换为不同的格式，例如“2013-06-29”作为 MarkLogic 默认日期格式？

任何帮助表示赞赏...

我已经创建了 transform.xqy 并将其安装在 MLogic 中的模块上。我正在考虑使用“xdmp:node-replace”将日期替换为预期格式。或者我应该逐列浏览 csv 列（如何做？）并使用“castable as xs:dateTime”来确定日期值与否。然而，即使只是打印出内容值/uri，总是给我错误。

xquery marklogic mlcp

2016-06-03T08:02:18.037

0 投票

2 回答

341 浏览

marklogic - 使用 MLCP 插入 MarkLogic DB 时检查空/空白

我正在探索 MarkLogic 数据库，并一直在尝试使用 MarkLogic 内容泵将数据导入其中。这是 csv 文件的要点。

我成功地将它插入数据库。这是插入的文档。

它甚至插入空白/空值。有没有办法指定在插入 ML 时忽略空白/空字段？这是我所期待的。

以及如何为我们插入的每个文档维护一个自动生成的主键/序列？如果 id 已经存在，它应该合并/更新文档。

提前致谢。

marklogic marklogic-8 mlcp marklogic-7

2016-06-08T14:16:46.523

0 投票

1 回答

267 浏览

xml - 在 MLCP 中作为 -query_filter 传递时，值运算符“<”（小于）符号无效

我正在使用 MLCP（Marklogic Content Pump）将内容从一个数据库复制到另一个数据库。在这个我使用-query_filter选项，它的值是一个 cts:query 以 XML 序列化格式的一组 cts:element-range-query 包装在 cts:and-query ：

现在，上面的查询在 ML Qconsole 上执行时返回有效结果，但是当传入 MLCP 的 -query_filter 选项时，它会给出错误消息'Invalid attribute value character '<'。

Marklogic 和 MLCP 的版本是 8.0-5。

在进一步深入研究这一点时，我发现问题仅在于运算符值小于“<”时

注意：我在数据库中为元素 "released-on" 配置了一个有效的范围索引。

xml xquery marklogic marklogic-8 mlcp

2016-07-06T07:55:53.293

0 投票

1 回答

123 浏览

xml - MLCP分批分离时的部分文件传输

在使用 MLCP 时，我在将文档从一个数据库复制到另一个数据库时遇到了选项文件（options.txt）中给出的“-batch_size”选项的一个奇怪问题，例如，如果-batch_size = 10 和要传输的文档数（在提供的基础过滤选项）是106，现在我执行命令： mlcp.bat -options_file "options.txt"

收到的内容泵统计信息如下：

似乎在批处理（batch size=10）之后剩下的剩余文档是10*10 + 6，这6 个文档没有传输到所需的数据库。

因此不知何故，它只传输属于完整批次的文件，而不是不能形成完整批次的剩余文件。

有人可以建议解决此问题的方法以及导致此行为的原因。

xml batch-processing marklogic marklogic-8 mlcp

2016-07-07T05:56:41.570

0 投票

1 回答

83 浏览

marklogic - 如何使用 MLCP 批量更新数据库

我必须使用 MLCP 更新我的数据库，这意味着数据库中有多个集合，因此我必须更改特定集合的元素或属性，那么我该如何实现呢？

marklogic marklogic-8 mlcp

2016-07-25T09:24:19.170

0 投票

2 回答

96 浏览

marklogic - 使用 MLCP 加载 EPUB

MarkLogic 不“处理”EPUB。公积金没有。MLCP 没有。

EPUB 是一个 zip，主要包含 xhtml、xml 和图片。我可以将它重命名为 .zip 并使用 MLCP 加载它。但是重命名不是很好，除非我在 URI 创建等中添加替换，否则它将显示在 URI 中。

此外，该.opf文件包含有用的信息，它是 XML，但读取为二进制。我可以将 .OPF 添加到 MIME 类型，但这不能与使用 MLCP 从存档加载相结合，然后它仍会再次显示为二进制。

我不想在数据加载到 ML 之前添加一个额外的层来“准备”数据。而且我想尽可能地保持信息的可读性/可索引性。

有没有比这更好的方法；重命名、解包和模拟输入以将 EPUB 文件加载到 MarkLogic 中？

marklogic epub mlcp

2016-09-13T07:30:17.640

0 投票

0 回答

129 浏览

marklogic - MLCP 数据库到数据库副本。带引号和不带引号的集合名称

在 mlcp db-to-db 复制后，源数据库有 6 个不带引号的集合名称，目标数据库具有带引号和不带引号的副本集合名称版本。当我将源数据库的备份恢复到目标数据库时，后者只有预期的 6 个未加引号的集合名称。目标数据库在 mlcp 任务之前被清除，并在开始 mlcp 运行之前检查为空。我使用的脚本似乎相当不起眼：

有任何想法吗？

marklogic mlcp

2016-10-04T09:38:57.343

0 投票

1 回答

163 浏览

xquery - Marklogic mlcp - 从文件系统中删除输入文件的选项

MLCP中是否有任何选项可以在我的输入文件成功加载到 ML 数据库后删除它们？

我正在运行我的 MLCP 脚本，而不是从运行我的 ML 的同一台服务器上运行。

让我知道是否有任何参数可以删除它。Recordloader 有一些删除输入的选项，我在 mlcp 中没有看到任何选项。

xquery marklogic marklogic-8 mlcp

2016-10-27T18:48:19.307

0 投票

1 回答

58 浏览

marklogic - 在数据库中加载数据时出现 uri 问题

在通过 MLCP 将数据插入数据库以获取唯一 uri 时，我可以同时使用命令-generate_uri和{any one element name} 吗？-uri_id或者我可以在 MLCP 命令中使用多个元素名称（-uri_id {first element name}，{second element name}）。请任何建议。

marklogic marklogic-8 mlcp

2016-11-10T14:58:01.947

问题标签 [mlcp]

Reference