我正在对每个大小约为 800MB(大小相等)的 HDF5 文件循环直方图操作。直方图的结果存储在文本文件中,每个文件有约 5 列 x 30 行。
t0 = time.time()
for f in filelist:
d = h5py.File(f,'r')
result = make_histogram(d['X'].value)
ascii_write(result)
print time.time()-t0
d.close()
对于每个文件,一次通过循环通常似乎需要约 6-7 秒。然而,在某些时候,通过一个循环需要更长的时间。如果我尝试多次运行不同的文件,那么这个时间点似乎是随机开始的。
我注意到在我的系统监视器中,此时 CPU 处于“磁盘睡眠”状态。我怎样才能解决这个问题?
这似乎与这个问题有关,但我找不到明确的答案。