我正在使用 pyspark 1.3.1,我需要为数据框中的每一行生成唯一的 ID/编号。
由于 Pyspark 版本:1.3.1 不提供窗口函数,因此我无法使用 rownumber 函数。
如何在没有 rownumber 函数且不将数据帧转换为 RDD 的情况下引入 rownumber?
我正在使用 pyspark 1.3.1,我需要为数据框中的每一行生成唯一的 ID/编号。
由于 Pyspark 版本:1.3.1 不提供窗口函数,因此我无法使用 rownumber 函数。
如何在没有 rownumber 函数且不将数据帧转换为 RDD 的情况下引入 rownumber?