0

如何在python中解析这个正则表达式?

在这里,我需要以有效的方式解析“From”和“date time stamp”之间的字符串“ Miracle workers ”。

    s = """
      business hours. Keyword Search: Sales, Operations, Director, Medical, Medical Devices, DME, Respiratory Equipment, Sales Rep, Account Executive, Exec, Business... <br />
             From Miracle Workers - 26 Apr 2012 08:45:15 GMT
          -  View all <a href="http://www.indeed.com/l-Houston,-TX-jobs.html">Houston    jobs</a>
    """

这是我正在做的正则表达式。我需要获得有效的正则表达式。

    regex1 = re.findall('From\ ([A-Za-z\ ]+)\-',s)
     ['Miracle Workers ']

从 url 中提取另一个字符串。

  s2 = http://www.indeed.com/job/Region-Manager-Field-Sales-at-Covidien-in-Atlanta,-GA-a1a421aabb4d54a7"
  regex2 = re.findall('-in-([A-Za-z-]+),-([A-Z]{2})',str(job.url))[0]

在这里,我得到了两个像('Atlanta', 'GA')这样的元组,而不是需要得到 " Atlanta,GA"

它应该如何做才能在所有情况下以有效的方式获得结果?

4

1 回答 1

1

使用 () 你对结果进行分组,这样,findall 给你一个元组。试试这个正则表达式(不分组):

regexp = '-in-[A-Za-z-]+,-[A-Z]{2}'
于 2012-04-27T14:13:42.007 回答