python - 散布在整个文本中的字符模式的正则表达式

Question

我是 Python 和正则表达式菜鸟。我设法通过以下语句将一整页的 html 源代码放入命令行。

print (driver.page_source).encode('utf-8')

凉爽的。但是该文本中有一些可预测的字符串，我需要提取这些字符串并将其存储到一个数组中。正在查找的字符串模式是，[4 个数字] 后跟一个 [连字符]，后跟 1 到 5 个数字，例如：

2013-80324 或 2013-03 但不是 2013-832888

谢谢你的帮助。

score 2 · Accepted Answer

(?:^|(?<=\D))\d{4}-\d{1,5}(?=\D|$)

1 回答 1