我想用一些额外的过滤条件用小 RDD 迭代一个 BIG RDD。下面的代码工作正常,但该过程仅在 Driver 和 Not spread-ed 跨节点的情况下运行。所以请建议任何其他方法?
val cross = titlesRDD.cartesian(brRDD).cache()
val matching = cross.filter{ case( x, br) =>
((br._1 == "0") &&
(((br._2 ==((x._4))) &&
((br._3 exists (x._5)) || ((br._3).head==""))
}
谢谢,马杜