1

我正在尝试打开一个文本文件并打印它的第一行。

我的代码是:

dataFile = open('data/AllData_2000001_3000000.txt', 'r', encoding="latin-1")
print(dataFile.read(1000))

输入是

The bug is hitting

我的输出是

ÿþT h e  b u g  i s  h i t t i n g

iso-8859-1也给出相同的结果。
当我尝试utf-8时,出现以下错误:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte

我的错误是什么?
谢谢!

4

1 回答 1

4

ÿþ可能是文件中的BOM 。UTF-16尝试在打开它时将其指定为您的编码。

于 2013-08-11T20:47:06.580 回答