我有一个文本文件,其中的文本应该被解释为 utf-8 但不是(它是以这种方式给我的)。以下是文件典型行的示例:
\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f
应该是:
ロンドン在住
现在,我可以通过在命令行中键入以下内容在 python 上手动执行此操作:
>>> h1 = u'\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f'
>>> print h1
ロンドン在住
这给了我我想要的。有没有办法让我自动做到这一点?我试过做这样的事情
>>> f = codecs.open('testfile.txt', encoding='utf-8')
>>> h = f.next()
>>> print h
\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f
我也尝试过“编码”和“解码”功能,有什么想法吗?
谢谢!