Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我是 Python 和正则表达式菜鸟。我设法通过以下语句将一整页的 html 源代码放入命令行。
print (driver.page_source).encode('utf-8')
凉爽的。但是该文本中有一些可预测的字符串,我需要提取这些字符串并将其存储到一个数组中。正在查找的字符串模式是,[4 个数字] 后跟一个 [连字符],后跟 1 到 5 个数字,例如:
2013-80324 或 2013-03 但不是 2013-832888
谢谢你的帮助。
(?:^|(?<=\D))\d{4}-\d{1,5}(?=\D|$)
?:
^
$
\d
[0-9]
\D
{n}
n
{m,n}
m