我有一个带有 user_tag 列的数据框,我想拥有新的随机 UUID 值,我该怎么做?
--------------------------------------
| user_tag | pref_code | name |
--------------------------------------
| abc123 | Reg | Richard |
| abc123 | Reg | Mort |
| abc123 | Disc | Jack |
我想在 spark 中为 user_tag 生成 randomUUID。具有
-------------------------------------------------------------------
| user_tag | pref_code | name |
-------------------------------------------------------------------
| af3fb8b8-7ceb-4cec-ac27-2a034bb44bb9 | Reg | Richard |
| snc22fls-2cgb-sas2-hc26-43d35ggg4522 | Reg | Mort |
| afgdw8b8-4fss-ycec-ycd7-haj3jbbj4bj9 | Disc | Jack |
我试过这个:但它导致每一行的 UUID 相同
val withUUID = dataFrame.withColumn("user_tag",
when(col("user_tag") === "abc123", randomUUID.toString).otherwise(col("user_tag")))