1

我正在尝试加载 xml gzip 文件,并且我正在将输入 xml 破坏为多个 xml 记录。但是如果存在特定的 xml 标记或 xml 值,mlcp 是否有办法在加载时忽略记录。如果不是,我的其他选择是什么?

以下是我现在用来加载 gzip xml 文件并中断单个记录的选项

import
-host
xxxxx
-port
xxxx
-username
xxxx
-password
xxxx
-batch_size
1
-input_compressed
true
-input_compression_codec
gzip
-input_file_type
aggregates
-output_collections
wos
-output_permissions
rest-reader,read,rest-writer,update
-output_uri_prefix
/wos/
-output_uri_suffix
.xml
-aggregate_record_element
REC
-aggregate_record_namespace
http://xxxx.yyyy.com
-uri_id
UID
4

1 回答 1

3

我只能考虑使用 MLCP 转换 ( -transform_moduleea),您可以在其中有条件地通过 $content map:map。如果要抑制特定的聚合片段,则返回空序列。

于 2018-04-06T15:19:20.027 回答