我有文本文件,其中包含以下格式的制表符分隔列:
fileName Type sc1 sc2 sc3 sc4 sc5 sc6
file1 abc 0 0.2 0 0 0 0
file1 xyz 0 0.8 0 0 0.8 0.2
file2 abc 0.5 0 0 0.1 0 0
file2 xyz 0 0 0 0.7 0.003 0.1
file3 abc 0.002 0 0 0 0.04 0
file3 xyz 0.5 0 0 0 0 0.3
.
.
第一行是标题行。sc1、sc2、sc3 等分别为 1、2、3 分(它们不全为零)
有两种以上的类型,每个文件具有相同数量的类型。
如何知道 xyz 类型的 sc6 最低的文件名? 或者如何从此文件创建另一个文本文件,该文件将具有所有 xyz 类型的文件名和 sc6?
我真的不想将它作为数据库加载或做类似的事情。我想知道我是否可以使用 Unix 的cut
,sort
或grep
命令相当快地完成这项工作。任何 perl、awk 解决方案也可以接受。
如果问题不是很清楚,请告诉我。
PS请随时为这个问题提出不同的标题。这是我能想到的最好的。