我将尝试改写我的问题:
如何将 dask.dataframe 与 zip 之类的功能结合起来?
假设我们有一个名为“accounts.0.csv”的文件,其中包含以下数据
id,names,amount
352,Dan,4837
387,Tim,208
42,Jerry,21
129,Patricia,284
我写了这段代码
import dask.dataframe as dd
import itertools
from dask.threaded import get
df = dd.read_csv('accounts.0.csv')
dsk = {'a': (dd.read_csv,('accounts.0.csv')),
'b': (itertools.repeat,(True)),
'res': (zip, 'a'[id],'b')
}
get(dsk, 'res')
此代码应生成如下内容:
352, True
387, True
42 , True
129, True
我怎样才能做到这一点 ?