0

我正在尝试在 python 中创建一个正则表达式来检测 7 位数字并从 .vcf 文件更新联系人。然后它将数字修改为 8 位数字(只需在数字前添加 5)。事情是正则表达式不起作用。

我收到错误消息“扫描字符串文字时 EOL”

regex=re.compile(r'^(25|29|42[1-3]|42[8-9]|44|47[1-9]|49|7[0-9]|82|85|86|871|87[5-8]|9[0-8])/I s/^/5/')

#Open file for scanning
f = open("sample.vcf")

#scan each line in file
for line in f:
    #find all results corresponding to regex and store in pattern
    pattern=regex.findall(line)
#isolate results
    for word in pattern:
        print word
        count = count+1 #display number of occurences
        wordprefix = '5{}'.format(word)
        s=open("sample.vcf").read()
        s=s.replace(word,wordprefix)
        f=open("sample.vcf",'w')
        print wordprefix
        f.write(s)
        f.close()       

我怀疑我的正则表达式的格式不正确,无法检测具有 2 位数字的特定数字模式,这些数字具有特定格式,例如 25x 和 29x 以及可以是任何数字模式的 5 位数字。(总共 7 位数字)

任何人都可以帮助我了解在这种情况下采用的正确格式吗?

4

1 回答 1

1

/I不是你如何在 python 中为正则表达式提供修饰符。而且你也不会像s///.

您应该使用re.sub()for 替换,并将修饰符作为re.I, 作为 的第二个参数re.compile

reg = re.compile(regexPattern, re.I)

然后对于 string s,替换将如下所示:

re.sub(reg, replacement, s)

因此,您的正则表达式对我来说看起来很奇怪。如果要匹配以25or开头的 7 位数字,29则应使用:

r'(2[59][0-9]{5})'

对于替换,请使用"5\1". 总之,对于 string s,您的代码如下所示:

reg = re.compile(r'(2[59][0-9]{5})', re.I)
new_s = re.sub(reg, "5\1", s)
于 2013-08-31T14:35:15.597 回答