2

我有一个 csv 文件,其中两列(v3 和 v7)对于所有观察都是空白的:

v1,v2,v3,v4,v5,v6,v7
GNB,1980,,20,-1.168689,0.4619077,
GNB,1981,20,-1.185176,0.4619077,

我正在使用 csv2rec 函数将其读入 python (epd-7.0-2):

from pylab import rec2csv, csv2rec
all_data = csv2rec(infile)

当我尝试增加第三或第七行中的值时,我收到一个错误(其他列不会发生):

all_data = csv2rec(infile)
all_data.v3 = 'test'

RuntimeError:无法在对象数组上调用 setfield

所以我尝试更改类型,只是遇到其他错误:

all_data.v3.dtype = '|S30'
TypeError: Cannot change data-type for object array.

另一个问题是我也无法更改数组中的其他列:

all_data.v1 = 'test'
RuntimeError: cannot call setfield on an object array

想法?谢谢,

4

1 回答 1

2

Use the .astype method:

all_data.astype(dtype=[('v1', 'S3'), ('v2', '<i4'), ('v3', '|S30'), ('v4', '<f8'), ('v5', '<f8'), ('v6', '<f8'), ('v7', 'O')])
#rec.array([('GNB', 1980, '-1', 20.0, -1.168689, 0.4619077, None),
#           ('GNB', 1981, '20', -1.185176, 0.4619077, nan, None)], 
#             dtype=[('v1', 'S3'), ('v2', '<i4'), ('v3', 'S30'), ('v4', '<f8'), ('v5', '<f8'), ('v6', '<f8'), ('v7', 'O')])
于 2013-05-17T05:21:25.463 回答