1

我有一个格式正确的单个 json 文件,它是一个文档数组(大约 60,000 个)。我可以使用节点 api 导入它,但只是想知道如何使用 Marklogic 内容泵 ( windows ) 导入这个文件。

我尝试使用基本选项,它只创建了一个名为 orders.json 的文档

4

1 回答 1

2

对于 MLCP,格式正确的 JSON 聚合(称为行分隔的 JSON)文件不是对象数组。它是一个每行有一个字符串化对象的文件。想想 CSV,而不是 JSON 的东西。

想象一下,如果您传递一个数组 - MLCP 进程必须将整个文件解析为一个 JSON 数组来处理。每行一个对象意味着 MLCP 可以轻松地对文件进行分片并并行处理。事实上,如果您使用自动 URI,我认为它甚至不会解析为 JSON。

坏的:

[
  {
    "bar": "baz"
  },
  {
    "bar": "buz"
  }
]

好的:

{"bar":"baz"}
{"bar":"buz"}

可以在这里找到所有关于此的好东西:
MLCP 用户指南

相关部分是:( 准确的文档版本:'9.0-3,2017 年 9 月')

  • 4.10
  • 4.10.1
于 2017-11-09T07:11:34.997 回答