我使用以下代码在/中存储了一个包含大量NaN
值的大数据集:HDFStore
python
pandas
with get_store(work_path+'/stores/store.h5') as store:
for chunk in reader:
for column in column_list:
store.append('%s' % column, chunk[column],
data_columns=column)
然后我想将第一列加载为numpy
数组,所以我有:
array = store.select(column_list[0]).as_matrix()
问题是我得到了一个没有任何初始NaN
值的小数组,因为当我将数据存储在存储中时,它有点“忘记”这些NaN
值,只保留非NaN
值及其索引。如何取回具有初始NaN
值的数组?