0

我有一组以 ANSI 或 UTF-16LE 编码的文件。我希望 python 使用正确的编码打开文件。问题是 ANSI 文件在使用 UTF-16le 编码时不会引发任何异常,反之亦然。

有没有一种直接的方法可以使用正确的文件编码打开文件?

4

3 回答 3

4

使用chardet库来检测编码。

于 2009-05-04T09:26:14.063 回答
0

您可以检查文件开头的BOM以检查它是否为 UTF。

然后unicode.decode相应地(使用标准编码之一)。

编辑 或者,也许,尝试 s.decode('ascii') 你的字符串(给定 s 是变量名)。如果它抛出 UnicodeDecodeError,则将其解码为“utf_16_le”。

于 2009-05-04T09:27:06.463 回答
0
于 2009-05-05T12:09:00.827 回答