PEP 440列出了 Python 包的版本字符串可接受的格式。
这些可以很简单,例如:0.0.1
或者复杂的,比如:2016!1.0-alpha1.dev2
什么是可用于查找和验证此类字符串的合适正则表达式?
我有同样的问题。这是我能找到的最彻底的正则表达式模式。PEP440 在其参考部分链接到打包库的代码库。
pip install packaging
要仅访问模式字符串,您可以使用全局
from packaging import version
version.VERSION_PATTERN
见:https ://github.com/pypa/packaging/blob/16.7/packaging/version.py#L159
# Deliberately not anchored to the start and end of the string, to make it
# easier for 3rd party code to reuse
VERSION_PATTERN = r"""
v?
(?:
(?:(?P<epoch>[0-9]+)!)? # epoch
(?P<release>[0-9]+(?:\.[0-9]+)*) # release segment
(?P<pre> # pre-release
[-_\.]?
(?P<pre_l>(a|b|c|rc|alpha|beta|pre|preview))
[-_\.]?
(?P<pre_n>[0-9]+)?
)?
(?P<post> # post release
(?:-(?P<post_n1>[0-9]+))
|
(?:
[-_\.]?
(?P<post_l>post|rev|r)
[-_\.]?
(?P<post_n2>[0-9]+)?
)
)?
(?P<dev> # dev release
[-_\.]?
(?P<dev_l>dev)
[-_\.]?
(?P<dev_n>[0-9]+)?
)?
)
(?:\+(?P<local>[a-z0-9]+(?:[-_\.][a-z0-9]+)*))? # local version
"""
当然,这个例子是特定于 Python 的正则表达式风格的。
我认为这应该符合 PEP440:
^(\d+!)?(\d+)(\.\d+)+([\.\-\_])?((a(lpha)?|b(eta)?|c|r(c|ev)?|pre(view)?)\d*)?(\.?(post|dev)\d*)?$
时代,例如2016!
:
(\d+!)?
版本部分(主要、次要、补丁等):
(\d+)(\.\d+)+
可接受的分隔符(.
,-
或_
):
([\.\-\_])?
可能的预发布标志(及其规范化;以及发布后标志r
或rev
)可能具有以下一位或多位数字:
((a(lpha)?|b(eta)?|c|r(c|ev)?|pre(view)?)\d*)?
发布后标志和一位或多位数字:
(\.?(post|dev)\d*)?