1

我有 1M dask 数据框行。我正在尝试将字典值分配给数据框的新列。

df = df.assign(c=lambda x: {"a": x.a, "b": x.b})

print(df.compute())

实现这一目标的最佳方法是什么?

PS:我正在尝试使用进度条来跟踪进度,其中代码真的快到 67% 并且挂断了。我的 CPU 和内存消耗得非常少,但代码正在运行,感觉好像永远不会完成。

4

1 回答 1

0

也许是以下?(未经测试)

df["c"] = df.apply(lambda row: {"a": row.a, "b": row.b})
于 2020-06-12T00:19:32.957 回答