python - 可以使用 latin-1 编码写入标准输出，但不能写入文件（Python 2.6）

Question

我有 unicode 数据并希望将其写入文件。我正在使用python 2.6。我能够打印编码值，但无法将其写入文件。环境的默认编码是 UTF-8。也尝试使用编解码器，但也没有运气。这是我正在使用的示例代码片段。

#!/usr/bin/python
import sys
import codecs
import csv

sh = [u'T\xe9l\xe9vista S.A.', u'T\xe9l\xe9vista S.A.', 'Python']
print sys.stdout.encoding
f = codecs.open('listwrite.txt', 'w', encoding='latin-1')
for item in sh:
  f.write(item)
f.close()

for i in sh:
  print i.encode('latin-1')

#

输出：

UTF-8
Télévista S.A.
Télévista S.A.
Python

Contents of listwrite.txt
TÃ©lÃ©vista S.A.TÃ©lÃ©vista S.A.Python

#

如上所示，该文件是用 UTF-8 编码而不是 Latin-1 编写的。如何更改它并覆盖文件的默认编码。

编辑：2

此外，使用 csv 编写器编写会给出 UnicodeEncodeError: 'ascii' codec can't encode character u'\xe9' in position 1: ordinal not in range(128)

下面的代码：

#!/usr/bin/python
import sys
import codecs
import csv

sh = [u'T\xe9l\xe9vista S.A.', u'T\xe9l\xe9vista S.A.', 'Python']
print sys.stdout.encoding
c = csv.writer(codecs.open('listwrite.txt', 'w', encoding='latin-1'), quoting=csv.QUOTE_NONE)
c.writerow(sh)
f.close()

for i in sh:
  print i.encode('latin-1')

score 3 · Accepted Answer

我认为您从错误的角度解决了问题。在写入之前尝试对每一行进行编码：

import csv
sh = [u'T\xe9l\xe9vista S.A.', u'T\xe9l\xe9vista S.A.', 'Python']

f = open('listwrite.txt', 'wb') # binary mode
writer = csv.writer(f)
writer.writerow([item.encode('latin-1') for item in sh])
f.close()

现在您有了一个正确的 latin1 编码文件：

$ cat listwrite.txt | iconv -f latin1
Télévista S.A.,Télévista S.A.,Python
$ file listwrite.txt 
listwrite.txt: ISO-8859 text, with CRLF line terminators

python - 可以使用 latin-1 编码写入标准输出，但不能写入文件（Python 2.6）

1 回答 1

Related

Reference