我正在尝试使用 numpy.loadtxt 加载数据...我尝试读取的文件使用的是 cp1252 编码。是否有可能使用 numpy 将编码更改为 cp1252?
以下
import numpy as np
n = 10
myfile = '/path/to/myfile'
mydata = np.loadtxt(myfile, skiprows = n)
给出:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf6 in position 189: invalid start byte
该文件包含元数据(前 n 行),后跟一个浮点数表。
编辑:仅在 Ubuntu (12.04) 上运行此问题时才会出现此问题。在 Windows 上它运行良好。出于这个原因,我认为这个问题与编码有关。
Edit2:打开文件如下所示也很好用:
import codecs
data = codecs.open(myfile, encoding='cp1252')
datalines = data.readlines()
但是我想使用 np.loadtext 将数据直接读入一个 numpy 数组。