问题标签 [mlcp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
406 浏览

javascript - marklogic mlcp 自定义转换将聚合文档拆分为多个文件

我有一个 JSON“聚合”文件,我想使用 mlcp 将其拆分并作为多个文档摄取到 MarkLogic 中。

我想在摄取期间使用 javascript 转换内容

我的 JSON 文件如下所示:

...并且我想通过 MLCP 运行此文件,以便每个文档都包含数组中的一个项目。

即一个文档将包含 {blobA},另一个将包含 {blobB},另一个将包含 {blobC}....等等。

如何编写我的自定义 .sjs 转换模块?

0 投票
2 回答
671 浏览

xquery - 使用 mlcp、csv 文件导入数据并转换解析日期

我有一个 csv 文件。我已经使用 mlcp 管理将这些数据导入 MarkLogic,然后在 MarkLogic 中创建了一个 xml 文件。

现在在 csv 中,我在其中一列中随机使用了这种格式“6/29/2013 5:00:00 PM”。如何使用 xquery 和可能的节点替换作为转换函数将此日期转换为不同的格式,例如“2013-06-29”作为 MarkLogic 默认日期格式?

任何帮助表示赞赏...


我已经创建了 transform.xqy 并将其安装在 MLogic 中的模块上。我正在考虑使用“xdmp:node-replace”将日期替换为预期格式。或者我应该逐列浏览 csv 列(如何做?)并使用“castable as xs:dateTime”来确定日期值与否。然而,即使只是打印出内容值/uri,总是给我错误。

0 投票
2 回答
341 浏览

marklogic - 使用 MLCP 插入 MarkLogic DB 时检查空/空白

我正在探索 MarkLogic 数据库,并一直在尝试使用 MarkLogic 内容泵将数据导入其中。这是 csv 文件的要点。

我成功地将它插入数据库。这是插入的文档。

它甚至插入空白/空值。有没有办法指定在插入 ML 时忽略空白/空字段?这是我所期待的。

以及如何为我们插入的每个文档维护一个自动生成的主键/序列?如果 id 已经存在,它应该合并/更新文档。

提前致谢。

0 投票
1 回答
267 浏览

xml - 在 MLCP 中作为 -query_filter 传递时,值运算符“<”(小于)符号无效

我正在使用 MLCP(Marklogic Content Pump)将内容从一个数据库复制到另一个数据库。在这个我使用-query_filter选项,它的值是一个 cts:query 以 XML 序列化格式的一组 cts:element-range-query 包装在 cts:and-query :

现在,上面的查询在 ML Qconsole 上执行时返回有效结果,但是当传入 MLCP 的 -query_filter 选项时,它会给出错误消息'Invalid attribute value character '<'

Marklogic 和 MLCP 的版本是 8.0-5。

在进一步深入研究这一点时,我发现问题仅在于运算符值小于“<”时

注意:我在数据库中为元素 "released-on" 配置了一个有效的范围索引

0 投票
1 回答
123 浏览

xml - MLCP分批分离时的部分文件传输

在使用 MLCP 时,我在将文档从一个数据库复制到另一个数据库时遇到了选项文件(options.txt)中给出的“-batch_size”选项的一个奇怪问题,例如,如果-batch_size = 10 和要传输的文档数(在提供的基础过滤选项)是106,现在我执行命令: mlcp.bat -options_file "options.txt"

收到的内容泵统计信息如下:

似乎在批处理(batch size=10)之后剩下的剩余文档是10*10 + 6,这6 个文档没有传输到所需的数据库。

因此不知何故,它只传输属于完整批次的文件,而不是不能形成完整批次的剩余文件。

有人可以建议解决此问题的方法以及导致此行为的原因。

0 投票
1 回答
83 浏览

marklogic - 如何使用 MLCP 批量更新数据库

我必须使用 MLCP 更新我的数据库,这意味着数据库中有多个集合,因此我必须更改特定集合的元素或属性,那么我该如何实现呢?

0 投票
2 回答
96 浏览

marklogic - 使用 MLCP 加载 EPUB

MarkLogic 不“处理”EPUB。公积金没有。MLCP 没有。

EPUB 是一个 zip,主要包含 xhtml、xml 和图片。我可以将它重命名为 .zip 并使用 MLCP 加载它。但是重命名不是很好,除非我在 URI 创建等中添加替换,否则它将显示在 URI 中。

此外,该.opf文件包含有用的信息,它是 XML,但读取为二进制。我可以将 .OPF 添加到 MIME 类型,但这不能与使用 MLCP 从存档加载相结合,然后它仍会再次显示为二进制。

我不想在数据加载到 ML 之前添加一个额外的层来“准备”数据。而且我想尽可能地保持信息的可读性/可索引性。

有没有比这更好的方法;重命名、解包和模拟输入以将 EPUB 文件加载到 MarkLogic 中?

0 投票
0 回答
129 浏览

marklogic - MLCP 数据库到数据库副本。带引号和不带引号的集合名称

在 mlcp db-to-db 复制后,源数据库有 6 个不带引号的集合名称,目标数据库具有带引号和不带引号的副本集合名称版本。当我将源数据库的备份恢复到目标数据库时,后者只有预期的 6 个未加引号的集合名称。目标数据库在 mlcp 任务之前被清除,并在开始 mlcp 运行之前检查为空。我使用的脚本似乎相当不起眼:

有任何想法吗?

0 投票
1 回答
163 浏览

xquery - Marklogic mlcp - 从文件系统中删除输入文件的选项

MLCP中是否有任何选项可以在我的输入文件成功加载到 ML 数据库后删除它们?

我正在运行我的 MLCP 脚本,而不是从运行我的 ML 的同一台服务器上运行。

让我知道是否有任何参数可以删除它。Recordloader 有一些删除输入的选项,我在 mlcp 中没有看到任何选项。

0 投票
1 回答
58 浏览

marklogic - 在数据库中加载数据时出现 uri 问题

在通过 MLCP 将数据插入数据库以获取唯一 uri 时,我可以同时使用命令-generate_uri和{any one element name} 吗?-uri_id或者我可以在 MLCP 命令中使用多个元素名称(-uri_id {first element name},{second element name})。请任何建议。