1

我有一组分隔文本文件存储在本地文件系统的目录中。我想使用 mlcp 将所有这些分隔的文本文件摄取到 marklogic 中。

在摄取时,我正在对输入内容进行一些转换,以在每个摄取的文档中创建一个新字段,其值将是其源文件名。这样做的目的是根据不同的文件源对摄取的文档进行分类。为此,我想将输入文件名传递给转换模块。

有什么办法可以做到这一点吗?

4

1 回答 1

2

您可以:

  • -transform_param=$filename分别为每个 csv 调用 MLCP,并以某种方式在命令行上使用传递 csv 的文件名,
  • 或者(可能更容易),使用 抓住转换内每个记录的 uri map:get($content, "uri"),并使用字符串操作从该 uri 中提取原始 csv 名称

于 2018-08-13T11:15:13.333 回答