我有一个包含如下字符串的文件:
NM_???? chr12 - 10 110 10 110 3 10,50,100, 20,60,110,
我对最后两列感兴趣,第一列是逗号分隔的外显子列表,最后一个是逗号分隔的外显子列表。
也就是说,我做了以下事情:
fp = open(infile, 'r')
for line in fp:
tokens = line.split()
exonstarts = tokens[8][:-1].split(',')
exonends = tokens[9][:-1].split(',')
zipped = list(zip(exonstarts, exonends))
现在我有一个看起来像这样的列表:
[(10, 20), (50, 60), (100, 110)]
我还有一个问题,我想要这些东西。因此,例如,我想要chr_string[10:20]+chr_string[50:60]+chr_string[100:110]
有一种方法可以轻松地说出这个吗?