0

我有一个包含以下内容的纯文本文件:

Test: \u0410\u0412\u0422\u041e

我尝试在 python 中读取该文件并使用 unicode 打印字符,如下所示:

import codecs
f = codecs.open('b.txt', encoding='utf-8')
for line in f:
    print line

输出:

Test: \u0410\u0412\u0422\u041e

我正在写这篇文章:

Test: ABTO

“测试”后面的西里尔单词表示停止。

4

1 回答 1

2

你有一个带有 unicode 转义序列的 ascii 文件;的形式\u0410...,我们必须将其转换为形式\\u0410....,以便我们可以应用解码功能如下。

f = open('b','r')
for line in f:
    line.replace('\u','\\u')
    print line.decode('unicode-escape')
于 2012-08-29T15:31:35.797 回答