5

我有一个如下所示的 3 元组列表 [我添加了换行符以提高可读性]:

(2, 127, 3)
(12156, 127, 3)
(4409, 127, 2) <-- 4409 occurs 2x
(1312, 127, 12) <-- 1312 occurs 3x

(4409, 128, 1) <-- 
(12864, 128, 1)
(1312, 128, 1) <-- 
(2664, 128, 2)

(12865, 129, 1)
(183, 129, 1)
(12866, 129, 2)
(1312, 129, 10) <--

我想根据第一个条目进行总结。第一个条目应该是唯一的。

结果应如下所示:

(2, 127, 3)
(12156, 127, 3)
(4409, 127, 3) <- new sum = 3
(1312, 127, 23) <- new sum = 23

(12864, 128, 1)
(2664, 128, 2)

(12865, 129, 1)
(183, 129, 1)
(12866, 129, 2)

如何在 Scala 中实现这一点?

4

3 回答 3

6

尝试这个:

list groupBy {_._1} mapValues {v => (v.head._1, v.head._2, v map {_._3} sum)}

中间条目被保留,它总是采用出现在输入列表中的第一个条目。

于 2012-04-08T19:13:31.453 回答
3

如果您可以忽略中间条目,则:

val l = List(('a,'e,1), ('b,'f,2), ('a,'g,3), ('b,'h,4))
l.groupBy(_._1).mapValues(_.map(_._3).sum) 
// Map('b -> 6, 'a -> 4)

如果您必须保留中间条目:

l.groupBy(_._1).map { 
  case (_, values) =>
    val (a,b,_) = values.head
    (a, b, values.map(_._3).sum)
} 
// List(('b,'f,6), ('a,'e,4))
于 2012-04-08T19:09:23.053 回答
0

您可以使用幺半群的概念。如果条目的前两个值构建键值,其余的值构建关联值本身,则可以使用 Map。

一旦你有了一个地图,你可以这样进行: 合并两个地图并对相同键的值求和的最佳方法?

于 2012-04-09T10:02:57.667 回答