我使用 spark mongo-connector 将数据从 mongodb 集合同步到 hdfs 文件,如果通过 mongos 读取集合,我的代码可以正常工作,但是当涉及到 local.oplog.rs 时,只能通过 mongod 读取副本集合,它给了我例外:
原因:com.mongodb.hadoop.splitter.SplitFailedException:无法计算输入拆分:找不到索引拆分键{_id:1}
我认为oplog.rs和普通collection的数据结构不同,oplog.rs没有“_id”属性,所以newAPIHadoopRDD不能正常工作,是吗?