1

我想定义一组操作并在 dask 工作人员上运行它们,并捕获可能出现的任何错误,而无需调用计算并将结果提供给客户端。

例如,如果我在对象列上执行 astype(int),这应该会给我一个错误。当我使用 client.persist 时,这不会给我一个错误。

column = df['string column'].astype(int)
client.persist(column)

但是,client.compute 确实会引发此错误:

column = df['string column'].astype(int)
client.compute(column)
# ValueError ... Traceback (most recent call last)

有没有办法像在计算中一样立即获取错误,但不强制 Dask 将结果返回给客户端?

4

1 回答 1

2
column = column.persist()
dask.distributd.wait(column)
于 2020-06-12T00:20:44.177 回答