7

我正在从堆栈溢出帖子之一中遵循解决方案,我唯一的要求是如何在应用df.agg(sum())函数之前将要求和的值限制为小数点后 2 位?

例如:我有如下值, sum 函数将其相加,

2.346
1.549

但是我希望将值四舍五入到小数点后的 2 位,例如

2.35
1.55

在总结之前。我该怎么做?我找不到任何像 function 这样sum().round的子函数sum

注意:我使用的是 Spark 1.5.1 版本。

4

2 回答 2

15

您可以使用bround

val df = Seq(2.346, 1.549).toDF("A")
df.select(bround(df("A"), 2)).show
+------------+
|bround(A, 2)|
+------------+
|        2.35|
|        1.55|
+------------+


df.agg(sum(bround(df("A"), 2)).as("appSum")).show
+------------------+
|            appSum|
+------------------+
|3.9000000000000004|
+------------------+
                                          ^
df.agg(sum(df("A")).as("exactSum")).show
+--------+
|exactSum|
+--------+
|   3.895|
+--------+
于 2017-01-17T19:47:21.933 回答
5

上面的解决方案确实适用于 spark 2.0 版本,但是对于像我这样仍在使用 1.5.*+ 版本的人来说是可行的。(我使用了 @Psidom 建议的圆形函数):

val df = Seq(2.346, 1.549).toDF("A")
df.select(bround(df("A"), 2)).show
+------------+
|bround(A, 2)|
+------------+
|        2.35|
|        1.55|
+------------+

val total=df.agg(sum(round(df.col(colName),2)).cast("double")).first.getDouble(0)
total: Double = 3.90
于 2017-01-17T22:55:35.963 回答