问题标签 [mlcp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
44 浏览

csv - 当我将 csv 文件发送到 marklogic 时,它不会覆盖前一个文件吗?

我将以下 csv 文件发送到 marklogic

通过 mlcp 使用以下命令

What happened ?

当我看到查询控制台时,我有一个 JSON 文档,其中包含以下信息

What i am expecting ?

默认情况下,通过创建 json/xml 文档获取 csv 的第一列。因为我要发送 3 行,所以它应该有最新的信息(即第 3 行)。

By Assumption

由于我在 mlcp 中一次发送所有三行,我们不能说哪一行首先发送到 ML DB

让我知道我的假设是对还是错..

谢谢

0 投票
1 回答
119 浏览

csv - 使用 MLCP 将原始数据摄取到 Marklogic 中的挑战

我想使用 MLCP 将一些 RAW 数据转换为 marklogic,但数据的形式如下

使用 MLCP 将此数据发送到 ML 9 的挑战是

  • 首先第一行没有列名,通常在使用 mlcp 时,第一行成为下面各个列的列名。除了在第一行中包含列名之外,还有什么方法可以将它们传递给 marklogic。
  • 其次,由于第一列是相同的值。生成 URI 时,将采用第一个列名,因此摄取到 ML 中的数据被覆盖。在我的 csv 文件中没有唯一的列值,所以我不知道如何为文档生成唯一的 URI。

任何帮助表示赞赏

谢谢

0 投票
0 回答
79 浏览

hadoop - 带有 Hadoop 的 Marklogic 9?

我使用 marklogic 连接器将 ML 9 与 hadoop 集成。我想使用 hadoop 将数据从本地机器加载到 marklogic。在他们提到的文档中,有两种使用 hadoop 加载数据的方法

  1. 使用 MLCP 将数据从 HDFS 导入 ML

  2. 使用 MLCP 将数据从 ML 导出到 HDFS

    我想知道有什么方法可以通过我的hadoop直接将数据从MLCP发送到ML,因为我想通过给予等来使用hadoop的mapreduceinput_split功能-max_split_size。我知道 MLCP 是在 mapreduce 中构建的,因为我的 hadoop 集群有很多我想使用它的处理能力。

谢谢

0 投票
1 回答
657 浏览

marklogic - 在将 MLCP 摄取到 MarkLogic 期间使用转换模块

当我通过 MLCP 摄取文档时,我正在尝试实现信封模式

我的转换模块是这样的:

我的 MLCP 命令是这样的

MLCP 错误:

我不知道为什么它无法uri在我的转换模块中读取。任何帮助表示赞赏

谢谢

0 投票
0 回答
87 浏览

xquery - Windows 10 的 Marklogic MLCP java 类路径配置

我需要在 Windows 10 系统中为 MLCP 工具配置类路径。谁能告诉我类路径和系统变量中包含的配置是什么?如果您有示例路径配置,请提供给我。

0 投票
1 回答
111 浏览

marklogic - MarkLogic MLCP 工具无法在端口 8000 上运行 SSL

我能够在(安全套接字层)上使用 SSL 打开 admin/QConsole GUI。但是 MLCP 无法在启用 SSL 的端口 8000 上运行。我必须关闭 SSL 才能使 MLCP 工作。

如何设置 MLCP 以使用 SSL?

我目前正在使用 Marklogic 版本 8.0-7 和 mlcp-8.0-5。

0 投票
1 回答
57 浏览

marklogic - MLCP 加载压缩的 xml 文件并跳过带有特定 xml 标签的 xml 文件

我正在尝试加载 xml gzip 文件,并且我正在将输入 xml 破坏为多个 xml 记录。但是如果存在特定的 xml 标记或 xml 值,mlcp 是否有办法在加载时忽略记录。如果不是,我的其他选择是什么?

以下是我现在用来加载 gzip xml 文件并中断单个记录的选项

0 投票
1 回答
135 浏览

marklogic - MCLP uri_id,如何在聚合 xml 中指定 xml 标签的属性

我想知道是否可以让正在加载的文档的 uri 从聚合 xml 中的 xml 标记属性中提取?

在上面的示例中,我将每个文档提取<Trial>为单独的文档,并且我希望文档 uri_id 成为标签中的属性id<Trial>这可能吗?以下是我的 mlcp 选项示例

0 投票
1 回答
341 浏览

marklogic - MLCP 使用文档选择器导出所选文档

我想使用基于 xpath 匹配的 MLCP 从 MarkLogic 导出选定的文档。

在这里,我想导出所有符合/companymetadata/companyCode=shiv此条件的文档,但出现以下错误

请帮助我解决上述错误并指导我将 xpath 与 MLCP 一起使用。

0 投票
1 回答
134 浏览

nosql - 将多字符“~|^”分隔文件的 MLCP 摄取到 Marklogic 中

我有一个带有分隔符的分隔文本文件~|^。我需要使用 MLCP 将此文件摄取到 marklogic 中。为此,我尝试使用 2 种方式摄取 MLCP。

  1. 使用没有选项文件的 MLCP

    mlcp.sh import -username admin -password admin -input_file_type delimited_text -delimiter "~|^" -document_type json -host localhost -database test -port 8052 -output_uri_prefix /test/data/ -generate_uri -output_uri_suffix .json \-output_collections "Test" -input_file_path inputfile1.csv

  2. 将 MLCP 与选项文件一起使用

    mlcp.sh import -username admin -password admin -options_file delim.opt -document_type json -host localhost -database test -port 8052 -output_uri_prefix /test/data/ -generate_uri -output_uri_suffix .json \-output_collections "Test" -input_file_path inputfile1.csv

我的选项文件如下所示(delim.opt):

但在这两种方式中,mlcp 都不起作用,我收到以下错误:

java.lang.IllegalArgumentException:无效的分隔符:~|^

谁能帮助我如何通过 MLCP 将这些类型的 CSV 文件摄取到 MarkLogic 中?