我只是想导入一个中文txt文件并打印出内容。这是我从网上复制的txt文件的内容,它是简体中文:http ://stock.hexun.com/2013-06-01/154742801.html
起初,我尝试了这个:
userinput = raw_input('Enter the name of a file')
f=open(userinput,'r')
print f.read()
f.close()
它可以打开文件并打印,但显示的内容是乱码。然后我尝试了以下编码:
#coding=UTF-8
userinput = raw_input('Enter the name of a file')
import codecs
f= codecs.open(userinput,"r","UTF-8")
str1=f.read()
print str1
f.close()
但是,它向我显示一条错误消息。UnicodeEncodeError: 'cp950 codec cant't encode character u'\u76d8' in position 50:illegal mutibyte sequence.
为什么会发生这个错误?如何解决?我尝试过其他 unicode,如 Big5、cp950 ......但它仍然无法正常工作。