0

所以基本上我对 Python 还是很陌生,我有一个问题,我有一个日文文档,我试图将其转换为 utf-8 编码的文档。当我这样做时,我真的不知道我应该得到什么回报。当我运行我目前拥有的程序时,它只会删除所有内容并给我留下一个空白的 utf-8 编码文档。这是我所拥有的,非常感谢任何帮助。

编辑:对不起,这是一个错字,我修复了原始编码。它是 Shift-jis。

import codecs

codecs.open("rshmn10j.txt", 'r', encoding='shift-jis')

newfile = codecs.open("rshmn10j.txt", 'w', encoding='utf-8')
newfile.write(u'\ufeff')
newfile.close()
4

1 回答 1

2

如果您尝试将文档从编码“x”转换为编码“utf8”,则首先必须使用编码它的编码来读取文档。

import codecs

original_document_encoding = "shift-jis" # common japanese encoding.
with codecs.open("rshmn10j.txt", 'r', encoding=original_document_encoding) as in_f:
    unicode_content = in_f.read()

with codecs.open("rshmn10j.out.txt", 'w', encoding='utf-8') as out_f:
    out_f.write(unicode_content)

with此处用于在退出块时自动关闭文件。

于 2012-10-31T00:14:00.853 回答