我想了解resize()
function 对numpy
array 与 an 的影响h5py dataset
。在我的应用程序中,我正在逐行读取文本文件,然后在解析数据后写入hdf5
文件。什么是实现这一点的好方法。我应该将每个新行添加到一个numpy
数组中并继续调整numpy 数组的大小(增加轴)(最终将完整的 numpy 数组写入 h5py 数据集),还是应该直接将每个新行数据添加到内存中h5py dataset
,从而调整h5py dataset
内存的大小。resize()
如果我们在每一行之后继续调整大小,函数如何影响性能?或者我应该在每 100 行或 1000 行之后调整大小?
每个数据集中可能有大约 200,000 行。
任何帮助表示赞赏。