需要保留原始数字而不是指数形式。我尝试使用最大长度强制转换为 DecimalType(38),但实际数字通过在末尾添加尾随零更改为不同的数字。还尝试了格式和描述方法,但没有运气。
原始数据
不工作
df["occasionAttributeID"].describe().apply(lambda x: format(x, 'f'))
不工作
df_5 = df.withColumn("colm", df["occasionAttributeID"].cast(DecimalType(18)))
df_5.groupby('colm').count().where(col('count') > 1).show()