有没有办法flatMap
像这样在 rdd 中展平列表:
rdd = sc.parallelize([[1,2,3],[6,7,8]])
rdd.flatMap(lambda r: [[r[0],r[1],r[2],[r[2]+1,r[2]+2]]]).collect()
我想要的输出:
[[1,2,3,4,5],[6,7,8,9,10]]
实际输出:
[[1,2,3,[4,5]], [6,7,8,[9,10]]]
我理解flatMap
适当地展平数组,我对上面的实际输出并不感到困惑,但我想知道是否有办法有效地展平内部列表。