问题标签 [mlcp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
csv - 当我将 csv 文件发送到 marklogic 时,它不会覆盖前一个文件吗?
我将以下 csv 文件发送到 marklogic
通过 mlcp 使用以下命令
What happened ?
当我看到查询控制台时,我有一个 JSON 文档,其中包含以下信息
What i am expecting ?
默认情况下,通过创建 json/xml 文档获取 csv 的第一列。因为我要发送 3 行,所以它应该有最新的信息(即第 3 行)。
By Assumption
由于我在 mlcp 中一次发送所有三行,我们不能说哪一行首先发送到 ML DB
让我知道我的假设是对还是错..
谢谢
csv - 使用 MLCP 将原始数据摄取到 Marklogic 中的挑战
我想使用 MLCP 将一些 RAW 数据转换为 marklogic,但数据的形式如下
使用 MLCP 将此数据发送到 ML 9 的挑战是
- 首先第一行没有列名,通常在使用 mlcp 时,第一行成为下面各个列的列名。除了在第一行中包含列名之外,还有什么方法可以将它们传递给 marklogic。
- 其次,由于第一列是相同的值。生成 URI 时,将采用第一个列名,因此摄取到 ML 中的数据被覆盖。在我的 csv 文件中没有唯一的列值,所以我不知道如何为文档生成唯一的 URI。
任何帮助表示赞赏
谢谢
hadoop - 带有 Hadoop 的 Marklogic 9?
我使用 marklogic 连接器将 ML 9 与 hadoop 集成。我想使用 hadoop 将数据从本地机器加载到 marklogic。在他们提到的文档中,有两种使用 hadoop 加载数据的方法
使用 MLCP 将数据从 HDFS 导入 ML
使用 MLCP 将数据从 ML 导出到 HDFS
我想知道有什么方法可以通过我的hadoop直接将数据从MLCP发送到ML,因为我想通过给予等来使用hadoop的mapreduce
input_split
功能-max_split_size
。我知道 MLCP 是在 mapreduce 中构建的,因为我的 hadoop 集群有很多我想使用它的处理能力。
谢谢
marklogic - 在将 MLCP 摄取到 MarkLogic 期间使用转换模块
当我通过 MLCP 摄取文档时,我正在尝试实现信封模式
我的转换模块是这样的:
我的 MLCP 命令是这样的
MLCP 错误:
我不知道为什么它无法uri
在我的转换模块中读取。任何帮助表示赞赏
谢谢
xquery - Windows 10 的 Marklogic MLCP java 类路径配置
我需要在 Windows 10 系统中为 MLCP 工具配置类路径。谁能告诉我类路径和系统变量中包含的配置是什么?如果您有示例路径配置,请提供给我。
marklogic - MarkLogic MLCP 工具无法在端口 8000 上运行 SSL
我能够在(安全套接字层)上使用 SSL 打开 admin/QConsole GUI。但是 MLCP 无法在启用 SSL 的端口 8000 上运行。我必须关闭 SSL 才能使 MLCP 工作。
如何设置 MLCP 以使用 SSL?
我目前正在使用 Marklogic 版本 8.0-7 和 mlcp-8.0-5。
marklogic - MLCP 加载压缩的 xml 文件并跳过带有特定 xml 标签的 xml 文件
我正在尝试加载 xml gzip 文件,并且我正在将输入 xml 破坏为多个 xml 记录。但是如果存在特定的 xml 标记或 xml 值,mlcp 是否有办法在加载时忽略记录。如果不是,我的其他选择是什么?
以下是我现在用来加载 gzip xml 文件并中断单个记录的选项
marklogic - MCLP uri_id,如何在聚合 xml 中指定 xml 标签的属性
我想知道是否可以让正在加载的文档的 uri 从聚合 xml 中的 xml 标记属性中提取?
在上面的示例中,我将每个文档提取<Trial>
为单独的文档,并且我希望文档 uri_id 成为标签中的属性id
,<Trial>
这可能吗?以下是我的 mlcp 选项示例
marklogic - MLCP 使用文档选择器导出所选文档
我想使用基于 xpath 匹配的 MLCP 从 MarkLogic 导出选定的文档。
在这里,我想导出所有符合/companymetadata/companyCode=shiv
此条件的文档,但出现以下错误
请帮助我解决上述错误并指导我将 xpath 与 MLCP 一起使用。
nosql - 将多字符“~|^”分隔文件的 MLCP 摄取到 Marklogic 中
我有一个带有分隔符的分隔文本文件~|^
。我需要使用 MLCP 将此文件摄取到 marklogic 中。为此,我尝试使用 2 种方式摄取 MLCP。
使用没有选项文件的 MLCP
mlcp.sh import -username admin -password admin -input_file_type delimited_text -delimiter "~|^" -document_type json -host localhost -database test -port 8052 -output_uri_prefix /test/data/ -generate_uri -output_uri_suffix .json \-output_collections "Test" -input_file_path inputfile1.csv
将 MLCP 与选项文件一起使用
mlcp.sh import -username admin -password admin -options_file delim.opt -document_type json -host localhost -database test -port 8052 -output_uri_prefix /test/data/ -generate_uri -output_uri_suffix .json \-output_collections "Test" -input_file_path inputfile1.csv
我的选项文件如下所示(delim.opt):
但在这两种方式中,mlcp 都不起作用,我收到以下错误:
java.lang.IllegalArgumentException:无效的分隔符:~|^
谁能帮助我如何通过 MLCP 将这些类型的 CSV 文件摄取到 MarkLogic 中?