我想去掉一串标点符号,最后我使用了
re.findall(r"[\w]+|[^\s\w]", text)
它工作正常,它确实解决了我的问题。我不明白的是括号内的细节和整个模式的东西。r"[\w]+|[^\s\w]"
真正的意思是什么?我在 Python 标准库中查找了它,它说:
re.findall(pattern, string, flags=0)
返回字符串中模式的所有非重叠匹配,作为字符串列表。从左到右扫描字符串,并按找到的顺序返回匹配项。如果模式中存在一个或多个组,则返回组列表;如果模式有多个组,这将是一个元组列表。空匹配包含在结果中,除非它们触及另一个匹配的开始。
我不确定我是否明白这一点,而且澄清对我来说有点含糊。谁能告诉我这种情况下的模式是什么意思以及它在 findall() 方法中是如何定义的?