我整天都在尝试完成这项任务,我真的很想学习如何使用 Python 来完成它。我想获取两个制表符分隔的文件,一个只有一个 ID,另一个具有相同的 ID 和一些描述。我可以使用 unix join 轻松地在共享 ID 字段上合并这些文件,但为此我需要对两者进行排序,并且我想保持第一个文件的顺序。
我在下面尝试了一些代码,我的方法是尝试将东西添加到元组中,据我了解,它们会在您添加时保持顺序。我还没有能够得到任何工作。任何人都可以帮忙吗?
示例文件:
file1 ->
111889
1437390
123
27998
2525778
12
1345
file2 ->
2525778'\t'item778
1345'\t'item110
123'\t'item1000
12'\t'item8889
111889'\t'item1111
1437390'\t'item222
27998'\t'item12
output ->
111889'\t'item1111
1437390'\t'item222
123'\t'item1000
27998'\t'item12
2525778'\t'item778
12'\t'item8889
1345'\t'item110
这是我到目前为止所拥有的:
import sys
add_list = ()
with open(sys.argv[1], 'rb') as file1, open(sys.argv[2], 'rb') as file2:
for line2 in file2:
f1, f2, f3 = line2.split('\t')
#print f1, f2, f3
for row in file1:
#print row
if row != f1:
break
else:
add_list.append(f1,f2,'\n')
break