1

可能重复:
匹配 Unicode 属性的 Python 正则表达式

我正在尝试将 PHP 中的这行代码移植到 Python:

preg_match_all('/\p{L}[\p{L}\p{Mn}\p{Pd}\'\x{2019}]*/u', $text, $tmp);

我得到了什么:

tmp = re.split('\p{L}[\p{L}\p{Mn}\p{Pd}\'\u2019]*', text, flags=re.U)

但是... Python 的正则表达式语法不支持\p- Unicode 字符属性!

有什么选择吗?

4

0 回答 0