我正在尝试使用正则表达式在字符串中查找英国邮政编码。
我在 RegexBuddy 中使用了正则表达式,见下文:
\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b
我有一堆地址,想从中获取邮政编码,示例如下:
市县某路名
镇123号PA23 6NH
我将如何在 Python 中解决这个问题?我知道re
Python 的模块,但我正在努力让它工作。
干杯
伊夫
我正在尝试使用正则表达式在字符串中查找英国邮政编码。
我在 RegexBuddy 中使用了正则表达式,见下文:
\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b
我有一堆地址,想从中获取邮政编码,示例如下:
市县某路名
镇123号PA23 6NH
我将如何在 Python 中解决这个问题?我知道re
Python 的模块,但我正在努力让它工作。
干杯
伊夫
使用邮政编码 PA23 6NH、PA2 6NH 和 PA2Q 6NH 重复您的地址 3 次作为您的模式测试,并使用维基百科中的正则表达式与您的匹配,代码是..
import re
s="123 Some Road Name\nTown, City\nCounty\nPA23 6NH\n123 Some Road Name\nTown, City"\
"County\nPA2 6NH\n123 Some Road Name\nTown, City\nCounty\nPA2Q 6NH"
#custom
print re.findall(r'\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b', s)
#regex from #http://en.wikipedia.orgwikiUK_postcodes#Validation
print re.findall(r'[A-Z]{1,2}[0-9R][0-9A-Z]? [0-9][A-Z]{2}', s)
结果是
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']
两个正则表达式都给出相同的结果。
尝试
import re
re.findall("[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}", x)
你不需要 \b。
#!/usr/bin/env python
import re
ADDRESS="""123 Some Road Name
Town, City
County
PA23 6NH"""
reobj = re.compile(r'(\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b)')
matchobj = reobj.search(ADDRESS)
if matchobj:
print matchobj.group(1)
示例输出:
[user@host]$ python uk_postcode.py
PA23 6NH