如何删除字符串中所有特殊字符的多次连续出现?
我可以得到如下代码:
re.sub('\.\.+',' ',string)
re.sub('@@+',' ',string)
re.sub('\s\s+',' ',string)
对于个人和最好的情况,对列表中的所有字符使用循环,例如:
from string import punctuation
for i in punctuation:
to = ('\\' + i + '\\' + i + '+')
string = re.sub(to, ' ', string)
但我相信也有一种有效的方法。
我试过了:
re.sub('[^a-zA-Z0-9][^a-zA-Z0-9]+', ' ', '\n\n.AAA.x.@@+*@#=..xx000..x..\t.x..\nx*+Y.')
但它会删除所有特殊字符,除了一个以字母开头的字符。
字符串可以有不同的连续特殊字符,例如99@aaaa*!@#$.
但不一样++--...
。