我正在尝试使用python查找刺“þ”字符,并用管道“|”替换。例如,该文件的内容类似于 125650+383736+392647。下面是我的代码:
f = codecs.open(path, encoding='utf-8', mode='r+')
contents = f.read()
if u'\u00FE' in contents:
print 'Found thorn'
我在 contents = f.read() 行出现错误:UnicodeDecodeError: 'utf8' codec can't decode byte 0xfe in position 7: invalid start byte
似乎文件对象 f 无法解码刺字符。这里有什么问题?提前致谢