我正在使用PyPI 模块regex
进行正则表达式匹配。它说
默认 Unicode 字边界
该
WORD
标志将“字边界”的定义更改为默认 Unicode 字边界的定义。这适用于\b
和\B
。
但似乎什么都没有改变:
>>> r1 = regex.compile(r".\b.", flags=regex.UNICODE)
>>> r2 = regex.compile(r".\b.", flags=regex.UNICODE | regex.WORD)
>>> r1.findall("русский ελλανικα")
['й ', ' ε']
>>> r2.findall("русский ελλανικα")
['й ', ' ε']
我没发现有什么不同……?