谁能解释我这种奇怪的行为?我希望这两种替换方法都可以同时工作或不工作。是只有我还是有人觉得这不连贯?
>>> u'è'.replace("\xe0","")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)
>>> re.sub(u'è','\xe0','',flags=re.UNICODE)
''
(请注意,我并不是要解释为什么 u'è'.replace("\xe0","") 会引发错误!)