使用
re.findall(r'\w+', ip)
在Fältskog
回报F
和ltskog
。我尝试使用字符串和 unicode 但相同。结果
使用
re.findall(r'\w+', ip)
在Fältskog
回报F
和ltskog
。我尝试使用字符串和 unicode 但相同。结果
您需要设置适当的 标志(在这种情况下UNICODE
说明re
什么\w
意思):
re.findall(r'\w+', ip, re.UNICODE)
# EDIT
Python 2.7.3 (default, Aug 1 2012, 05:16:07)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>> re.findall(r"\w+", u"Fältskog", re.UNICODE)
[u'F\xe4ltskog']
>>>
re.findall(r'[åäöÅÄÖ\w]+', ip)
如果您想更直观,也可以这样做。