编辑: http: //pastebin.com/W4iG3tjS - 文件
我有一个用 utf8 编码的文本文件,其中包含一些西里尔文文本。要加载它,我使用以下代码:
import codecs
fopen = codecs.open('thefile', 'r', encoding='utf8')
fread = fopen.read()
fread
将文件转储到屏幕上所有 unicodish(转义序列)。print fread
以可读的形式显示它(我猜是ASCII)。
然后我尝试拆分它并将其写入一个没有编码的空文件:
a = fread.split()
for l in a:
print>>dasFile, l
但我收到以下错误消息:UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-13: ordinal not in range(128)
有没有办法转储fread.split()
到文件中?我怎样才能摆脱这个错误?