使用 dask 数据框
df = dask.dataframe.from_pandas(df, npartitions=5)
series = df.apply(func)
future = client.compute(series)
progress(future)
在 jupyter 笔记本中,我可以看到每个分区完成多少 apply() 调用的进度条(例如 2/5)。
dask 有没有办法报告每个分区内的进度?
类似于tqdm
progress_apply()
熊猫的东西。