我有一个数据文件,例如:
82 DEX26_28_h
82 DEX26_28_h
873 DEX34_h
89 DEX37_h
1 DEX34_h
我打算通过 $2 进行排序,以便列中的每个项目(17 个唯一项)彼此相邻。然后我想在 1 美元中总结所有#,同时拴在 2 美元上
上述测试文件的理想结果:
164 DEX26_28_h
874 DEX34_h
89 DEX27_h
有道理?基本上需要总结每个样本($2)发生的序列总数($1),并且 uniq 在保持总和的同时只需要 $2。这样最终的结果就变成了 17 行。
我是否应该通过 $2 中的 17 个标识中的每一个来查找,然后使用 awk 对它们求和?
你们有什么感想?