python可以扩展w+
and匹配的内容W+
吗?我如何在其列表中添加更多字符?
为什么?浏览一些文本并发现有一些字符我想添加到单词定义中,例如&
and æ
。
如果我无法添加到单词定义中,那么如何添加到我的函数中:
re.findall(r'\w+', txt)
re.findall(r'\W+', txt)
Well\w
是一组预定义的字符,您不能以编程方式修改\w
. 但是您可以使用语法设置一个匹配任何字符\w
以及您想要的任何其他字符的组。[]
所以你会改变你的正则表达式
[\w\&æ]+
或者
[\W\&æ]+
分别
这匹配\w
or\W
集中的任何字符并添加 & 和 æ。您可以在regexpal上使用这些表达式。
在预编译模式中使用字符组。
lower_match_chars = re.compile('[\\w\\&]+')
upper_match_chars = re.compile('[\\W\\&]+')
all_lower_matches = re.findall(lower_match_chars, txt)
all_upper_matches = re.findall(upper_match_chars, txt)