问题标签 [mlcp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - marklogic mlcp 自定义转换将聚合文档拆分为多个文件
我有一个 JSON“聚合”文件,我想使用 mlcp 将其拆分并作为多个文档摄取到 MarkLogic 中。
我的 JSON 文件如下所示:
...并且我想通过 MLCP 运行此文件,以便每个文档都包含数组中的一个项目。
即一个文档将包含 {blobA},另一个将包含 {blobB},另一个将包含 {blobC}....等等。
如何编写我的自定义 .sjs 转换模块?
xquery - 使用 mlcp、csv 文件导入数据并转换解析日期
我有一个 csv 文件。我已经使用 mlcp 管理将这些数据导入 MarkLogic,然后在 MarkLogic 中创建了一个 xml 文件。
现在在 csv 中,我在其中一列中随机使用了这种格式“6/29/2013 5:00:00 PM”。如何使用 xquery 和可能的节点替换作为转换函数将此日期转换为不同的格式,例如“2013-06-29”作为 MarkLogic 默认日期格式?
任何帮助表示赞赏...
我已经创建了 transform.xqy 并将其安装在 MLogic 中的模块上。我正在考虑使用“xdmp:node-replace”将日期替换为预期格式。或者我应该逐列浏览 csv 列(如何做?)并使用“castable as xs:dateTime”来确定日期值与否。然而,即使只是打印出内容值/uri,总是给我错误。
marklogic - 使用 MLCP 插入 MarkLogic DB 时检查空/空白
我正在探索 MarkLogic 数据库,并一直在尝试使用 MarkLogic 内容泵将数据导入其中。这是 csv 文件的要点。
我成功地将它插入数据库。这是插入的文档。
它甚至插入空白/空值。有没有办法指定在插入 ML 时忽略空白/空字段?这是我所期待的。
以及如何为我们插入的每个文档维护一个自动生成的主键/序列?如果 id 已经存在,它应该合并/更新文档。
提前致谢。
xml - 在 MLCP 中作为 -query_filter 传递时,值运算符“<”(小于)符号无效
我正在使用 MLCP(Marklogic Content Pump)将内容从一个数据库复制到另一个数据库。在这个我使用-query_filter选项,它的值是一个 cts:query 以 XML 序列化格式的一组 cts:element-range-query 包装在 cts:and-query :
现在,上面的查询在 ML Qconsole 上执行时返回有效结果,但是当传入 MLCP 的 -query_filter 选项时,它会给出错误消息'Invalid attribute value character '<'。
Marklogic 和 MLCP 的版本是 8.0-5。
在进一步深入研究这一点时,我发现问题仅在于运算符值小于“<”时
注意:我在数据库中为元素 "released-on" 配置了一个有效的范围索引。
xml - MLCP分批分离时的部分文件传输
在使用 MLCP 时,我在将文档从一个数据库复制到另一个数据库时遇到了选项文件(options.txt)中给出的“-batch_size”选项的一个奇怪问题,例如,如果-batch_size = 10 和要传输的文档数(在提供的基础过滤选项)是106,现在我执行命令:
mlcp.bat -options_file "options.txt"
收到的内容泵统计信息如下:
似乎在批处理(batch size=10)之后剩下的剩余文档是10*10 + 6,这6 个文档没有传输到所需的数据库。
因此不知何故,它只传输属于完整批次的文件,而不是不能形成完整批次的剩余文件。
有人可以建议解决此问题的方法以及导致此行为的原因。
marklogic - 如何使用 MLCP 批量更新数据库
我必须使用 MLCP 更新我的数据库,这意味着数据库中有多个集合,因此我必须更改特定集合的元素或属性,那么我该如何实现呢?
marklogic - 使用 MLCP 加载 EPUB
MarkLogic 不“处理”EPUB。公积金没有。MLCP 没有。
EPUB 是一个 zip,主要包含 xhtml、xml 和图片。我可以将它重命名为 .zip 并使用 MLCP 加载它。但是重命名不是很好,除非我在 URI 创建等中添加替换,否则它将显示在 URI 中。
此外,该.opf
文件包含有用的信息,它是 XML,但读取为二进制。我可以将 .OPF 添加到 MIME 类型,但这不能与使用 MLCP 从存档加载相结合,然后它仍会再次显示为二进制。
我不想在数据加载到 ML 之前添加一个额外的层来“准备”数据。而且我想尽可能地保持信息的可读性/可索引性。
有没有比这更好的方法;重命名、解包和模拟输入以将 EPUB 文件加载到 MarkLogic 中?
marklogic - MLCP 数据库到数据库副本。带引号和不带引号的集合名称
在 mlcp db-to-db 复制后,源数据库有 6 个不带引号的集合名称,目标数据库具有带引号和不带引号的副本集合名称版本。当我将源数据库的备份恢复到目标数据库时,后者只有预期的 6 个未加引号的集合名称。目标数据库在 mlcp 任务之前被清除,并在开始 mlcp 运行之前检查为空。我使用的脚本似乎相当不起眼:
有任何想法吗?
xquery - Marklogic mlcp - 从文件系统中删除输入文件的选项
MLCP中是否有任何选项可以在我的输入文件成功加载到 ML 数据库后删除它们?
我正在运行我的 MLCP 脚本,而不是从运行我的 ML 的同一台服务器上运行。
让我知道是否有任何参数可以删除它。Recordloader 有一些删除输入的选项,我在 mlcp 中没有看到任何选项。
marklogic - 在数据库中加载数据时出现 uri 问题
在通过 MLCP 将数据插入数据库以获取唯一 uri 时,我可以同时使用命令-generate_uri
和{any one element name} 吗?-uri_id
或者我可以在 MLCP 命令中使用多个元素名称(-uri_id {first element name},{second element name})。请任何建议。