我认为关于python编码的另一个问题。我有这个程序:
regex = re.compile(ur'\b[sw]\w+', flags= re.U | re.I)
ergebnisliste = []
for line in fileobject:
print str(line)
erg = regex.findall(line)
ergebnisliste = ergebnisliste + erg
ergebnislistesortiert = sorted(ergebnisliste, key=lambda x: len(x))
print ergebnislistesortiert
fileobject.close()
我正在文本文件中搜索以 s 或 w 开头的单词。我的“ergebnislistesortiert”是排序结果列表。我将打印结果列表,并且出现编码问题:
['so', 'Wer', 'sp\xc3']
'sp\xc3'应该打印为spät。这里有什么问题?为什么列表元素是utf-8?
我怎样才能得到正确的解码来打印“spät”?
非常感谢你们!