我正在尝试加载 xml gzip 文件,并且我正在将输入 xml 破坏为多个 xml 记录。但是如果存在特定的 xml 标记或 xml 值,mlcp 是否有办法在加载时忽略记录。如果不是,我的其他选择是什么?
以下是我现在用来加载 gzip xml 文件并中断单个记录的选项
import
-host
xxxxx
-port
xxxx
-username
xxxx
-password
xxxx
-batch_size
1
-input_compressed
true
-input_compression_codec
gzip
-input_file_type
aggregates
-output_collections
wos
-output_permissions
rest-reader,read,rest-writer,update
-output_uri_prefix
/wos/
-output_uri_suffix
.xml
-aggregate_record_element
REC
-aggregate_record_namespace
http://xxxx.yyyy.com
-uri_id
UID