6

我正在尝试使用正则表达式在字符串中查找英国邮政编码。

我在 RegexBuddy 中使用了正则表达式,见下文:

\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b

我有一堆地址,想从中获取邮政编码,示例如下:

市县某路名
镇123号PA23 6NH

我将如何在 Python 中解决这个问题?我知道rePython 的模块,但我正在努力让它工作。

干杯

伊夫

4

3 回答 3

10

使用邮政编码 PA23 6NH、PA2 6NH 和 PA2Q 6NH 重复您的地址 3 次作为您的模式测试,并使用维基百科中的正则表达式与您的匹配,代码是..

import re

s="123 Some Road Name\nTown, City\nCounty\nPA23 6NH\n123 Some Road Name\nTown, City"\
    "County\nPA2 6NH\n123 Some Road Name\nTown, City\nCounty\nPA2Q 6NH"

#custom                                                                                                                                               
print re.findall(r'\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b', s)

#regex from #http://en.wikipedia.orgwikiUK_postcodes#Validation                                                                                            
print re.findall(r'[A-Z]{1,2}[0-9R][0-9A-Z]? [0-9][A-Z]{2}', s)

结果是

['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']

两个正则表达式都给出相同的结果。

于 2008-12-18T15:42:50.377 回答
0

尝试

import re
re.findall("[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}", x)

你不需要 \b。

于 2008-12-18T15:40:05.483 回答
0
#!/usr/bin/env python

import re

ADDRESS="""123 Some Road Name
Town, City
County
PA23 6NH"""

reobj = re.compile(r'(\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b)')
matchobj = reobj.search(ADDRESS)
if matchobj:
    print matchobj.group(1)

示例输出:

[user@host]$ python uk_postcode.py 
PA23 6NH
于 2008-12-18T15:45:41.447 回答