我使用 marklogic 连接器将 ML 9 与 hadoop 集成。我想使用 hadoop 将数据从本地机器加载到 marklogic。在他们提到的文档中,有两种使用 hadoop 加载数据的方法
使用 MLCP 将数据从 HDFS 导入 ML
使用 MLCP 将数据从 ML 导出到 HDFS
我想知道有什么方法可以通过我的hadoop直接将数据从MLCP发送到ML,因为我想通过给予等来使用hadoop的mapreduce
input_split
功能-max_split_size
。我知道 MLCP 是在 mapreduce 中构建的,因为我的 hadoop 集群有很多我想使用它的处理能力。
谢谢