有没有办法缓存管道中实体的输出,如果我运行相同的管道但配置略有不同(想想超参数调整),管道中的某些初始步骤不受配置更改不会执行多次?
Raw data -> CPU expensive preprocessing (A) -> model fitting (B) -> model
我希望能够运行 A 一次,但 B 的多个变体。
在 Dagster 中是否有一种优雅的方法可以做到这一点?
我不知道存在此功能。
当存储设置为文件系统时,Dagster 可以重新运行实体,但在缓存方面没有看到任何像您所描述的那样。如果这里没有太大的吸引力,可以向 Dagster提交问题,然后再报告