1

我正在使用 python 抓取一个网站。返回的结果具有以下格式(https://regex101.com/r/irr14u/10),除了最后一次我得到 2 个日期匹配(第一个匹配:星期四-星期日)之外,一切正常。 、周二、周三和第二场比赛:周一)

我正在使用以下代码来获取我想要的值。我使用 BeautifoulSoup 来获取 movieDate 字符串,但在这里我对其进行了硬编码。

movieDate="Thur.-Sun., Tue., Wed.: 20.50/ 23.00, Mon. 23.00"

weekDays=re.match(',? *(?P<weekDays>[^\d:\n]+):? *(?P<startTime>[^,\n]+)', movieDate).groupdict()['weekDays']
startTime=re.match(',? *(?P<weekDays>[^\d:\n]+):? *(?P<startTime>[^,\n]+)', movieDate).groupdict()['startTime']

我想创建一个字典如下(它有两个键,因为它们是两个 startTime 值);第一个键将是周四至周日、周二、周三。值 =20.50/ 23.00,第二个键是星期一。价值=23:00。有时可能会有一个或两个以上的键。所以字典将如下所示;

dictionary={ Thur.-Sun., Tue., Wed.: 20.50/ 23.00, Mon.: 23.00}

有什么建议可以以一种无阻碍的方式实现这一目标吗?

4

1 回答 1

1

您可以使用函数实现所需的输出finditer,将捕获的组的结果动态附加到字典。

Python 片段:

import re
movieDate = """
Thur.-Sun., Tue., Wed.: 20.50/ 23.00, Mon. 23.00
"""

d = dict();
r = re.compile(',? *(?P<weekDays>[^\d:\n]+):? *(?P<startTime>[^,\n]+)')
for m in r.finditer(movieDate):
    d[m.group(1)] = m.group(2)

print(d)

印刷:

{'Thur.-Sun., Tue., Wed.': '20.50/ 23.00', 'Mon. ': '23.00'}
于 2018-08-08T19:00:47.430 回答