我不确定 dask(或 dask.dataframe)如何以 HDF5 格式存储数据。例如,Pandas 以基于行的格式存储数据。另一方面,vaex 需要基于列的 HDF5 文件。
从您的屏幕截图中,我看到您的 hdf5 文件还保留了索引列 - vaex 没有这样的列,并且只需要数据。
为确保 HDF5 文件与 vaex 一起使用,最好使用 vaex 本身进行 CSV->HDF5 转换。否则,也许像箭头这样的东西会起作用,因为它是一个标准(而 HDF5 可以更灵活,这更难支持所有可能的存储数据版本)。