作为对我之前的问题 [1] 的跟进,有没有办法在 vaex 中打开 hdf5 数据集,执行操作,然后将结果存储到同一个数据集?
我尝试了以下方法:
import vaex as vx
vxframe = vx.open('somedata.hdf5')
vxframe = some_transformation(vxframe)
vxframe.export_hdf5('somedata.hdf5')
这会导致错误OSError: Unable to create file (unable to truncate a file which is already open)
,因此h5py
在文件打开时无法写入文件。是否有另一个工作流程来实现这一目标?我可以写入另一个文件作为解决方法,但这似乎效率很低,因为(我想)它还必须复制所有未更改的数据。