在文本文件中,有一个字符串“我不喜欢这个”。
然而,当我把它读成一个字符串时,它变成了“我不喜欢这样\xe2\x80\x98t”。我知道 \u2018 是“'”的 unicode 表示。我用
f1 = open (file1, "r")
text = f1.read()
命令进行阅读。
现在,是否有可能以这样的方式读取字符串,当它被读入字符串时,它是“我不喜欢这个”,而不是“我不喜欢这个”?
第二次编辑:我看到有人使用映射来解决这个问题,但实际上,没有内置的转换可以将这种 ANSI 转换为 unicode(反之亦然)吗?