我是 Python 新手,所以这似乎很容易。我正在尝试删除所有#,数字,如果同一字母连续重复两次以上,我需要将其更改为仅两个字母。这项工作完美,但不适用于ØÆÅ。
有什么想法可以用 ØÆÅ 字母来完成吗?
#!/usr/bin/python
# -*- coding: utf-8 -*-
import math, re, sys, os, codecs
reload(sys)
sys.setdefaultencoding('utf-8')
text = "ån9d ånd ååååånd d9d flllllløde... :)asd "
# Remove anything other than digits
text = re.sub(r'#', "", text)
text = re.sub(r"\d", "", text)
text = re.sub(r'(\w)\1+', r'\1\1', text)
print "Phone Num : "+ text
我现在得到的结果是:
Phone Num : ånd ånd ååååånd dd flløde... :)asd
我想要的是:
Phone Num : ånd ånd åånd dd flløde... :)asd