我正在使用带有 scala 的 Spark。我想知道单行命令是否比单独的命令更好?如果有的话有什么好处?它是否在速度方面获得了更高的效率?为什么?
例如
var d = data.filter(_(1)==user).map(f => (f(2),f(5).toInt)).groupByKey().map(f=> (f._1,f._2.count(x=>true), f._2.sum))
反对
var a = data.filter(_(1)==user)
var b = a.map(f => (f(2),f(5).toInt))
var c = b.groupByKey()
var d = c.map(f=> (f._1,f._2.count(x=>true), f._2.sum))