在使用 MLCP 时,我在将文档从一个数据库复制到另一个数据库时遇到了选项文件(options.txt)中给出的“-batch_size”选项的一个奇怪问题,例如,如果-batch_size = 10 和要传输的文档数(在提供的基础过滤选项)是106,现在我执行命令:
mlcp.bat -options_file "options.txt"
收到的内容泵统计信息如下:
INFO contentpump.LocalJobRunner:com.marklogic.mapreduce.ContentPumpStats:
INFO contentpump.LocalJobRunner: INPUT_RECORDS: 106
INFO contentpump.LocalJobRunner: OUTPUT_RECORDS: 106
INFO contentpump.LocalJobRunner: OUTPUT_RECORDS_COMMITTED: 100
INFO contentpump.LocalJobRunner: OUTPUT_RECORDS_FAILED: 0
INFO contentpump.LocalJobRunner: Total execution time: 37 sec
似乎在批处理(batch size=10)之后剩下的剩余文档是10*10 + 6,这6 个文档没有传输到所需的数据库。
因此不知何故,它只传输属于完整批次的文件,而不是不能形成完整批次的剩余文件。
有人可以建议解决此问题的方法以及导致此行为的原因。