0

我得到这个输出:

不要\u0092t

unicode 字符 92 是正确的字符,但为什么不显示?正在从文件中读取此字符串。该文件的 chardet 输出为:

ISO-8859-2 有信心 0.795656700854

这就是我打开文件的方式:

File.open('file.txt', 'r:ISO-8859-2')

然后,使用给定的文件行,我将其输出如下:

puts line.encode('UTF-8')
4

1 回答 1

0

将文件打开语句更改为使用:'r:windows-1252:utf-8'。我猜 chardet 只是没有正确检测到编码。

于 2012-09-06T23:20:48.967 回答