问题标签 [mlcp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
417 浏览

marklogic - Marklogic Content Pump 通过 XSLT 转换生成多个文档

这是与MarkLogic 内容泵实用程序相关的第二个问题。

我正在将具有多条记录的单个聚合 XML 文档摄取到 MarkLogic 内容泵中。我希望将聚合 XML 文档转换为不同的格式,并且内容泵实用程序可以从单个输入的大型 xml 文档生成多个 xml 文档。?

示例:聚合输入 xml 文档:

内容泵的预期输出:两个格式不同的文档:

文件 1:

文件 2

我正在使用以下 XSLT 将上述文档拆分为两个节点:

输出:

下面是 XQuery 转换,它调用上面的“XSLT 文件”来生成两个节点:

上述 XQuery 转换失败并返回错误。那么,如何修改上述 XQuery 程序,使其从单个文档生成多个转换后的 XML 文档并为其编制索引?

MLCP 命令:

0 投票
1 回答
289 浏览

marklogic - 使用 MLCP 上传 XML 文件

我们正在尝试上传 xml 文件(其中一些是 2GB),但它们没有使用 MLCP 上传到数据库中。

  1. 我创建了一个新的数据库和森林以及新的端口。

  2. 对 mlcp.bat 进行了如下更改

    /li>
  3. Load_mlcp.txt 文件有以下代码

    /li>
  4. 在命令提示符下运行 mlcp.bat 文件,但在数据库中看不到任何 xml 文件(甚至不是小文件)。

  5. 我们收到错误:“批处理递归超出堆栈限制”和“批处理已中止”。

请帮助和建议。

0 投票
1 回答
108 浏览

xml - 片段 XML 文件

我有一个 XML 文件,它有很多<Tx>节点(大约 6922),并且在它下面有子节点,所以使用“片段根”方法是有意义的。您能否指导我应该使用哪种方法来分段 XML 文件:

  1. 为数据库中的片段根设置规则或
  2. 使用MLCP对 XML 进行分段

    /li>
  3. 如果我使用方法 2,那么这是否意味着如果我尝试基于<Tx>节点拆分 XML,那么将创建大约 6922 个 XML 片段?

请告知我对 XML 文件进行分段的方法是否正确?

0 投票
2 回答
314 浏览

marklogic - MLCP 分隔文件

我尝试加载数据。它不工作。

我尝试过:
多个分隔符,所有带引号的字段,所有字段不带,将标题从数据中删除,mlcp 中没有分隔符选项,mlcp 中的其他分隔符选项,其他计算机,其他 ML8 版本,其他 Java 版本,更少的数据,更多数据,有和没有转换。

我的外壳脚本:

数据

错误

0 投票
1 回答
217 浏览

marklogic - Marklogic 内容泵 (MLCP) 静默忽略以下划线开头的文件

我正在尝试导入一个文档集合,其中一些文件以下划线开头。似乎 Marklogic mlcp 8.0.4 正在默默地跳过这些文件,尽管 Marklogic 本身似乎对这样的文件名没有问题。

这是我正在使用的 mlcp 命令:

mlcp-8.0-4/bin/mlcp.sh import -host localhost -port 8012 -username xxxxx -password xxxx -mode local -input_file_path /Users/test/Downloads/tempfolder33/ -output_uri_replace "^.*tempfolder33,''"

其中像“/Users/test/Downloads/tempfolder33/schemas/bwb/_manifest.xml”这样的文件名始终被 mlcp 忽略。

关于如何解决这个问题的任何想法?

0 投票
3 回答
167 浏览

user-interface - 带有 GUI 的 MarkLogic 内容泵 (MLCP)

我已经尝试通过终端轻松使用 mlcp 泵,遵循 https://docs.marklogic.com/guide/ingestion/content-pump

但我不知道如何在网站中使用用户界面实现 mlcp 功能。我搜索了整个互联网领域,但无济于事。

请帮忙

0 投票
2 回答
118 浏览

marklogic - 如何在 MarkLogic 的 MLCP 批量操作中使用 dls:document-manage?

我们尝试对存储在 Marklogic 数据库中的文档执行dls:document-manage。我们尝试使用 MLCP 批量操作从文件系统加载多个文档,以及如何同时对所有这些文件执行dls:document-manage

0 投票
1 回答
135 浏览

xml - 使用 MLCP 的 Marklogic 编码插入

我已使用 XQuery 将内容中带有“’”的以下 XML 内容插入到 MarkLogic 服务器。

XML 内容

使用插入 XQuery

我正在使用以下 XQuery 导出相同的文档。

使用的导出 XQuery

并且导出输出 XML 看起来与源文档相同:

同样,我使用 MLCP 插入了源 XML,如果我导出了该文件,它如下所示:

但我的需要是具有与类似源相同的输出(即它应该是“debtor& #x2019;s”而不是“debtor's”),尽管使用 MLCP 插入。

对于通过 MLCP 插入的文档,是否有任何选项或解决方法可以像源文档一样导出?

我也试过-content_encoding ISO-8859-1,但我得到了相同的答案。

0 投票
1 回答
151 浏览

marklogic - Marklogic:导入时的 mlcp 权限问题

我在 Marklogic 8.0.4 mlcp 上。以下是我运行的命令:

./bin/mlcp.sh import -host localhost -username admin -password admin -input_file_path /file/path/to/RDF.owl -input_file_type RDF

这是我的日志:

不确定是什么问题,用户 admin 拥有所有权限。我还重新启动了一次 MarkLogic。

任何指针?

0 投票
1 回答
346 浏览

triggers - 使用 MLCP 加载数据时出现 XDMP-NEWSTAMP 错误

我有一个附加到 4 个森林的数据库,我想在每次文档中的任何值更改时在 MarkLgic 中创建一个更改文档。变更文件应包含变更日期、旧值和新值。

我能够通过使用提交前和提交后触发器来实现这一点。pre-commit 触发器捕获文档的旧版本,post-commit 具有新版本。我比较这两个文档并创建更改文档。这在更新单个文档时效果很好。

但是,我通过使用 MLCP 从分隔文件加载 20000 个文档来测试此解决方案。我更改了所有文档中单个元素的值,然后再次加载数据。我的触发器只能捕获 20000 个更改文档中的 7000 个。其余文档加载失败,我在 MLCP 中收到一条错误消息:

“XDMP-NEWSTAMP 时间戳对于森林来说太新了”

我通过从提交前和提交后触发器中删除我的代码进行了另一项测试,并且让触发器什么也不做。我再次加载了文件。现在 19000/20000 文档已成功更新,我得到相同的 XDMP-NEWSTAMP 错误。

当我完全删除触发器并加载文档时。20000/20000 被加载和更新。

因此,执行大量触发器似乎会在加载文档时产生问题。

这个问题有解决方案吗?我是否走错了路来完成我需要做的事情?

MLCP 命令: mlcp import -host localhost -port 8000 -username uname -password pwd -input_file_path D:....\file.dsv -delimiter '|' -input_file_type delimited_text -database Overtime -output_collections 测试

创建触发器:

加载触发器文档: