我正在尝试将带有分类列的 Dask 数据框存储到本教程*.h5
中的文件中- 1:23:25 - 1:23:45。
这是我对store
函数的调用:
stored = store(ddf,'/home/HdPC/Analyzed.h5', ['Tag'])
功能store
是:
@delayed
def store(ddf,fp,c):
ddf.categorize(columns=c).to_hdf(fp, '/data2')
并使用分类。
ddf
并且stored
是类型:
print(type(ddf), type(stored))
>>> (<class 'dask.dataframe.core.DataFrame'>, <class 'dask.delayed.Delayed'>)
当我运行compute(*[stored])
orstored.compute()
时,我得到这个:
dask.async.AttributeError: 'DataFrame' object has no attribute 'categorize'
有没有办法Tag
用函数实现列的这种分类store
?或者我应该使用不同的方法来存储分类的 Dask 数据帧?