我在 R 中为我的分析制作了一个字典,这个字典需要有唯一的标签。
我的数据看起来像这样
Labels t1 t2 t3
gene1 0.000000E+00 0.000000E+00 1.138501E-01
gene2 0.000000E+00 0.000000E+00 9.550272E-02
gene3 0.000000E+00 1.851936E-02 1.019907E-01
gene4 8.212816E-02 0.000000E+00 6.570984E+00
gene5 1.282434E-01 0.000000E+00 6.240799E+00
gene6 2.918929E-01 8.453281E-01 3.387610E+00
gene7 0.000000E+00 1.923038E-01 0.000000E+00
gene7 0.000000E+00 00000000E+00 0.000000E+00
gene8 1.135057E+00 0.000000E+00 2.491100E+00
gene9 7.935625E-01 1.070320E-01 2.439292E+00
gene10 5.046790E+00 0.000000E+00 2.459273E+00
gene11 3.293614E-01 0.000000E+00 2.380152E+00
gene11 3.293614E-01 0.000000E+00 2.380152E+00
gene12 0.000000E+00 0.000000E+00 1.474757E-01
gene13 0.000000E+00 0.000000E+00 1.521591E-01
gene14 0.000000E+00 9.968809E-02 8.387166E-01
gene15 0.000000E+00 1.065761E-01 0.000000E+00
这里表格中的标签gene7出现了两次,在这种情况下,所有列中的值都必须相加,并且应该选择具有最高值的值,而另一个应该被丢弃。在平局的情况下,如基因 11 的情况,应选择第一个,其他的则丢弃。
我尝试了 sort -u k2V,2 和许多组合,但失败了。
awk/python 中的任何一个内衬
好心的帮助
谢谢