我正在尝试使用新的正则表达式 findall来索引匹配,以便可以考虑重叠匹配。但是,我只能找到匹配项,但无法正确地为它们提供位置。
我的代码:
import regex as re
seq = "ATCCAAGGAGTTTGCAGAGGTGGCGTTTGCAGCATGAGAT"
substring="GTTTGCAG"
xx=re.findall(substring,seq,overlapped=True)
print xx
xx 看起来像
['GTTTGCAG', 'GTTTGCAG']
因为在 10-17 和 25-32 位置有两场比赛。
但是,我怎样才能获得这些数字呢?通过检查 dir(xx),我没有可以在这个新函数中使用的 start/end/pos。(我尝试了 xx.index(substring),但这似乎只给出了结果列表的索引:例如在这种情况下为 0 和 1)
谢谢你。