我在 spark 中有一个数据框,如下所示
a b
( 21 , 23 )
( 23 , 21 )
( 22 , 21 )
( 21 , 22 )
我想要一个看起来像这样的数据框:-
( 21 , 22 )
( 21 , 23 )
( 22 , 21 )
( 22 , 23 )
( 23 , 21 )
( 23 , 22 )
因此,它应该考虑两列的所有可能组合。如何做到这一点?
我尝试了笛卡尔连接,但是对于非常小的数据集来说需要太多时间。还有其他选择吗?
谢谢。