3

当我发现 python regex模块允许模糊匹配时,我越来越高兴,因为它似乎是我许多问题的简单解决方案。但是现在我遇到了一个问题,我没有从文档中找到任何答案。

如何使用新的模糊值功能将字符串编译成正则表达式?

为了说明我平时的需求,并给出一个示例一小段代码

import regex
f = open('liner.fa', 'r')
nosZ2f='TTCCGACTACCAAGGCAAATACTGCTTCTCGAC'
nosZ2r='AGGTCACATCAACGTCAACG'

#nini=regex.compile(nosZ2r{e<=3})

nimekiri=list(f)
pikkus=len(nimekiri)

count = 0
while (count < pikkus):
    line = nimekiri[count].rstrip('\n')
    m=regex.findall("(TTCCGACTACCAAGGCAAATACTGCTTCTCGAC){e<=3}", line)
    n=regex.findall("AGGTCACATCAACGTCAACG{e<=3}", line) 
    if bool(m) & bool(n):
        print nimekiri[count-1].rstrip('\n')
        print line
    count = count + 1

f.close()

如您所见,具有 3 个错误的模糊性的正则表达式工作正常。但是我被迫将整个字符串(nosZ2f/r)手动输入到 findall 中。我无法编译带有错误/模糊值的正则表达式。

将字符串(行 nosZ2f/r)转换为模糊值为 3 错误的正则表达式模式的正确语法是什么?(在注释行看到失败的尝试)

使用输入字符串作为正则表达式源的可能性对于我想到的任何实际有用的脚本都至关重要。(否则不会发生太多自动化)所以如果我能 frex,我会很高兴。代替

m=regex.findall("(TTCCGACTACCAAGGCAAATACTGCTTCTCGAC){e<=3}", line)

m=regex.findall(nini, line) etc.

或者

m=regex.findall("string{e<=3}", line)
4

1 回答 1

3

你需要把你的弦正确地放在一起。

import regex
testString = 'some phrase'
r = regex.compile('('+testString+'){e<=5}')
r.match('phrase')

如果要构建正则表达式模式,则需要使用各种字符串操作技术来构建要使用的适当模式。

于 2014-01-14T13:26:02.660 回答