我的数据表如下所示:
chr4 124097568 124098568 337
chr4 159597106 159598106 1000
chr4 159597106 159598106 1000
chr4 164361532 164362532 455
chr4 164361532 164362532 74
chr4 164361532 164362532 2
chr4 170360150 170361150 0
我想:提取唯一行 - 如果 col#2 和 col#3 中的数据相同 -> 应该只提取最高值 (col#4) 行。如果 #2,#3 & #4 相同,则应提取其中一行。
首选输出是:
chr4 124097568 124098568 337
chr4 159597106 159598106 1000
chr4 164361532 164362532 455
chr4 170360150 170361150 0
如果有不清楚的地方,我会尝试更多地解释它(因为我现在真的需要解决这个问题)。