现在,我知道已经回答了关于标点符号剥离的上千个问题。但是我的和我看过的有点不同。
我需要一个去掉所有标点符号、连字符和单撇号的代码。
到目前为止我发现的代码是:
import re
def textStrip():
text = input("Text? ")
return re.compile('\w+').findall(text)
这对于剥离所有标点符号非常有用,现在我想知道是否有办法为此添加例外?或者,如果有人有更好的方法,那将有很大帮助。谢谢!
样本:
"A tall-ish wall, with trim.I don't want to paint it;"
将返回:
["A", "tall-ish", "wall", "with", "trim", "I", "don't", "want", "to", "paint", "it"]