0

您可以在此处查看说明http://www.mdh.org/sites/www/healthapp/jobs/View.aspx?id=10

MDH人力资源

格兰特街 525 号

伊利诺伊州马科姆 61455

电话:309-836-1577

传真:309-836-1677

该页面有这个地址,我想使用正则表达式提取城市和州。在这种情况下,它是 Macomb 和 IL。

有一段时间,我使用了以下正则表达式,但在描述包含多个类似模式的情况下它不起作用。

(\w+),\s+(\w{2})\s+\d+

我如何编写正则表达式,它告诉首先提取这些地址行,然后是具有这种模式的行?

4

1 回答 1

0
^([A-Z][A-Za-z\s]*),\s+([A-Z]{2})\s+\d{5}$

我认为这足以让噪音远离。缺点是它可能会避免你想要的。在这种情况下,您可能希望使用像您这样的强度较低的正则表达式来遍历页面。无论如何,使用正则表达式无法达到完美。

它适用于Javascript。调整语法以满足 Python 的需要。

于 2013-01-28T09:49:09.230 回答