如果我有一个 dask 数据框 df. 现在我对其进行一些计算。
数学上,
df1 = f1(df)
df2 = f2(df1)
df3 = f3(df1)
现在,如果我跑步df2.compute()
,现在之后,如果我跑步df1.compute()
。如何阻止 dask 重新计算结果df1
?
以另一种情况为例,如果我运行df3.compute()
,则df2.compute()
。我如何告诉 dask 在运行时使用df1
(在 中计算df3.compute()
)的已计算值df2.compute()
?