我有一个包含几列(17)的data.frame。第 2 列有几行具有相同的值,我只想保留其中的一行,特别是第 17 列中具有最大值的行。
例如:
A B
'a' 1
'a' 2
'a' 3
'b' 5
'b' 200
Would return
A B
'a' 3
'b' 200
(加上其余的列)
到目前为止,我一直在使用独特的功能,但我认为它会随机保留一个或只保留第一个出现的功能。
** 更新 ** 真实数据有 376000 行。我已经尝试过 data.table 和 ddply 建议,但它们需要永远。知道哪个最有效吗?