问题标签 [mlcp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
marklogic - Marklogic Content Pump 通过 XSLT 转换生成多个文档
这是与MarkLogic 内容泵实用程序相关的第二个问题。
我正在将具有多条记录的单个聚合 XML 文档摄取到 MarkLogic 内容泵中。我希望将聚合 XML 文档转换为不同的格式,并且内容泵实用程序可以从单个输入的大型 xml 文档生成多个 xml 文档。?
示例:聚合输入 xml 文档:
内容泵的预期输出:两个格式不同的文档:
文件 1:
文件 2
我正在使用以下 XSLT 将上述文档拆分为两个节点:
输出:
下面是 XQuery 转换,它调用上面的“XSLT 文件”来生成两个节点:
上述 XQuery 转换失败并返回错误。那么,如何修改上述 XQuery 程序,使其从单个文档生成多个转换后的 XML 文档并为其编制索引?
MLCP 命令:
marklogic - 使用 MLCP 上传 XML 文件
我们正在尝试上传 xml 文件(其中一些是 2GB),但它们没有使用 MLCP 上传到数据库中。
我创建了一个新的数据库和森林以及新的端口。
对 mlcp.bat 进行了如下更改
/li>Load_mlcp.txt 文件有以下代码
/li>在命令提示符下运行 mlcp.bat 文件,但在数据库中看不到任何 xml 文件(甚至不是小文件)。
我们收到错误:“批处理递归超出堆栈限制”和“批处理已中止”。
请帮助和建议。
xml - 片段 XML 文件
我有一个 XML 文件,它有很多<Tx>
节点(大约 6922),并且在它下面有子节点,所以使用“片段根”方法是有意义的。您能否指导我应该使用哪种方法来分段 XML 文件:
- 为数据库中的片段根设置规则或
使用MLCP对 XML 进行分段
/li>如果我使用方法 2,那么这是否意味着如果我尝试基于
<Tx>
节点拆分 XML,那么将创建大约 6922 个 XML 片段?
请告知我对 XML 文件进行分段的方法是否正确?
marklogic - MLCP 分隔文件
我尝试加载数据。它不工作。
我尝试过:
多个分隔符,所有带引号的字段,所有字段不带,将标题从数据中删除,mlcp 中没有分隔符选项,mlcp 中的其他分隔符选项,其他计算机,其他 ML8 版本,其他 Java 版本,更少的数据,更多数据,有和没有转换。
我的外壳脚本:
数据
错误
marklogic - Marklogic 内容泵 (MLCP) 静默忽略以下划线开头的文件
我正在尝试导入一个文档集合,其中一些文件以下划线开头。似乎 Marklogic mlcp 8.0.4 正在默默地跳过这些文件,尽管 Marklogic 本身似乎对这样的文件名没有问题。
这是我正在使用的 mlcp 命令:
mlcp-8.0-4/bin/mlcp.sh import -host localhost -port 8012 -username xxxxx -password xxxx -mode local -input_file_path /Users/test/Downloads/tempfolder33/ -output_uri_replace "^.*tempfolder33,''"
其中像“/Users/test/Downloads/tempfolder33/schemas/bwb/_manifest.xml”这样的文件名始终被 mlcp 忽略。
关于如何解决这个问题的任何想法?
user-interface - 带有 GUI 的 MarkLogic 内容泵 (MLCP)
我已经尝试通过终端轻松使用 mlcp 泵,遵循 https://docs.marklogic.com/guide/ingestion/content-pump
但我不知道如何在网站中使用用户界面实现 mlcp 功能。我搜索了整个互联网领域,但无济于事。
请帮忙
marklogic - 如何在 MarkLogic 的 MLCP 批量操作中使用 dls:document-manage?
我们尝试对存储在 Marklogic 数据库中的文档执行dls:document-manage。我们尝试使用 MLCP 批量操作从文件系统加载多个文档,以及如何同时对所有这些文件执行dls:document-manage。
xml - 使用 MLCP 的 Marklogic 编码插入
我已使用 XQuery 将内容中带有“’”的以下 XML 内容插入到 MarkLogic 服务器。
XML 内容
使用插入 XQuery
我正在使用以下 XQuery 导出相同的文档。
使用的导出 XQuery
并且导出输出 XML 看起来与源文档相同:
同样,我使用 MLCP 插入了源 XML,如果我导出了该文件,它如下所示:
但我的需要是具有与类似源相同的输出(即它应该是“debtor& #x2019;s”而不是“debtor's”),尽管使用 MLCP 插入。
对于通过 MLCP 插入的文档,是否有任何选项或解决方法可以像源文档一样导出?
我也试过-content_encoding ISO-8859-1
,但我得到了相同的答案。
marklogic - Marklogic:导入时的 mlcp 权限问题
我在 Marklogic 8.0.4 mlcp 上。以下是我运行的命令:
./bin/mlcp.sh import -host localhost -username admin -password admin -input_file_path /file/path/to/RDF.owl -input_file_type RDF
这是我的日志:
不确定是什么问题,用户 admin 拥有所有权限。我还重新启动了一次 MarkLogic。
任何指针?
triggers - 使用 MLCP 加载数据时出现 XDMP-NEWSTAMP 错误
我有一个附加到 4 个森林的数据库,我想在每次文档中的任何值更改时在 MarkLgic 中创建一个更改文档。变更文件应包含变更日期、旧值和新值。
我能够通过使用提交前和提交后触发器来实现这一点。pre-commit 触发器捕获文档的旧版本,post-commit 具有新版本。我比较这两个文档并创建更改文档。这在更新单个文档时效果很好。
但是,我通过使用 MLCP 从分隔文件加载 20000 个文档来测试此解决方案。我更改了所有文档中单个元素的值,然后再次加载数据。我的触发器只能捕获 20000 个更改文档中的 7000 个。其余文档加载失败,我在 MLCP 中收到一条错误消息:
“XDMP-NEWSTAMP 时间戳对于森林来说太新了”
我通过从提交前和提交后触发器中删除我的代码进行了另一项测试,并且让触发器什么也不做。我再次加载了文件。现在 19000/20000 文档已成功更新,我得到相同的 XDMP-NEWSTAMP 错误。
当我完全删除触发器并加载文档时。20000/20000 被加载和更新。
因此,执行大量触发器似乎会在加载文档时产生问题。
这个问题有解决方案吗?我是否走错了路来完成我需要做的事情?
MLCP 命令: mlcp import -host localhost -port 8000 -username uname -password pwd -input_file_path D:....\file.dsv -delimiter '|' -input_file_type delimited_text -database Overtime -output_collections 测试
创建触发器:
加载触发器文档: