python - 在两个字典之间创建和匹配令牌

Question

更新所以我有一个看起来像这样的数千行的纺织品

BRCA A2ML1 Missense_Mutation TCsA-A1-A0SO A8K2U0 W408C

BRCA A2ML1 Missense_Mutation TCsA-A8-A08P A8K2U0 R433H

BRCA A2ML1 Missense_Mutation TCsA-B6-A0WZ A8K2U0 P1341L

我已经编写了代码来捕获整行并且只有第 6 个令牌（下面的代码）现在我正在尝试将第 6 个令牌与其自己的行匹配。

我希望得到的输出是我正在尝试编写一个看起来像这样的输出文件（这只是几个例子）

A8K2U0 |开始=1 结束.....| R433H |BRCA A2ML1 Missense_Mutation TCsA-A8-A08P A8K2U0 R433H

和其他行一样

A8K2U0 |开始=1 结束.....| P1341L |BRCA A2ML1 Missense_Mutation TCsA-B6-A0WZ A8K2U0 P1341L

这是我的字典代码：

lookup = defaultdict(list) 
wholelookup = defaultdict(list)
wholeline = defaultdict(list)
mydata = open('file.txt')

for line in csv.reader(mydata, delimiter='\t'):
    code = re.match('[a-z](\d+)[a-z]', line[-1], re.I)
    if code:      
       lookup[line[-2]].append(code.group(1))
       wholelookup[line[-2]].append(code.group(0))
       s=' '.join(line)
       wholeline[line[-2]].append(s)

score 1 · Accepted Answer

问题我如何使用 if 语句来找出是否A177T在COADREAD ZNF271 Missense_Mutation MAAA-AA-3947 Q14591 A177T？

琐碎：

test_string = 'A177T'
to_search = 'COADREAD ZNF271 Missense_Mutation MAAA-AA-3947 Q14591 A177T'
if test_string in to_search:
    print "found", test_string

或根据帝斯曼的建议：

test_string = 'A177T'
to_search = 'COADREAD ZNF271 Missense_Mutation MAAA-AA-3947 Q14591 A177T'
if test_string in to_search.split(' '):
    print "found", test_string

但我有一种明显的感觉，我误解了这个问题。

python - 在两个字典之间创建和匹配令牌

1 回答 1

Related

Reference