我正在尝试使用 dask. 如果我的 dask 数组被命名dask_data
,那么一个简单的dask_data.to_zarr("my_zarr.zarr")
就可以了。但据我了解,这是一个同步的、受 CPU 限制的过程。
我想做的是使用并行处理分配给 Quadro GV100 GPU 的大部分工作。我试图通过将 numpy.ndarray 转换为 cupy.ndarraydask_data_cupy = dask_data.map_blocks(cupy.asarray)
并将其写入 zarr 文件,但我收到:(
ValueError: object __array__ method not producing an array
坦率地说,我也没有看到性能提升)。
我如何使用 GPU 将 dask 数组并行写入 zarr 文件?
谢谢!