我有一个表格格式的巨大爆炸输出文件。我想根据蛋白质名称对数据进行排序,以查看哪些 seq-s 与该特定蛋白质对齐。假设我有
con19 sp|Q24K02|IDE_BOVIN 3
con19 sp|P35559|IDE_RAT 2
con15 sp|Q24K02|IDE_BOVIN 8
con15 sp|P14735|IDE_HUMAN 30
con16 sp|Q24K02|IDE_BOVIN 45
con16 sp|P35559|IDE_RAT 23
我想得到一个输出,两者都可以
sp|Q24K02|IDE_BOVIN con19 3 sp|Q24K02|IDE_BOVIN con19 3
con15 8 sp|Q24K02|IDE_BOVIN con15 8
con16 45 sp|Q24K02|IDE_BOVIN con16 45
sp|P35559|IDE_RAT con19 2 sp|P35559|IDE_RAT con19 2
con16 23 sp|P35559|IDE_RAT con16 23
sp|P14735|IDE_HUMAN con15 30 sp|P14735|IDE_HUMAN con15 30
f1 = open('file.txt','r')
lines=f1.readlines()
for line in lines:
a=sorted(lines)
r=open('file.txt','w')
r.writelines(a)
f1.close