1

python可以扩展w+and匹配的内容W+吗?我如何在其列表中添加更多字符?

为什么?浏览一些文本并发现有一些字符我想添加到单词定义中,例如&and æ

如果我无法添加到单词定义中,那么如何添加到我的函数中:

re.findall(r'\w+', txt)
re.findall(r'\W+', txt)
4

2 回答 2

6

Well\w是一组预定义的字符,您不能以编程方式修改\w. 但是您可以使用语法设置一个匹配任何字符\w以及您想要的任何其他字符的组。[]所以你会改变你的正则表达式

[\w\&æ]+

或者

[\W\&æ]+

分别

这匹配\wor\W集中的任何字符并添加 & 和 æ。您可以在regexpal上使用这些表达式。

于 2012-07-20T15:21:27.273 回答
0

在预编译模式中使用字符组。

lower_match_chars = re.compile('[\\w\\&]+')
upper_match_chars = re.compile('[\\W\\&]+')
all_lower_matches = re.findall(lower_match_chars, txt)
all_upper_matches = re.findall(upper_match_chars, txt)
于 2012-07-20T15:22:37.487 回答