运行以下代码时,dask.dataframe.head() 的结果取决于 npartitions:
import dask.dataframe as dd
import pandas as pd
df = pd.DataFrame({'A': [1,2,3], 'B': [2,3,4]})
ddf = dd.from_pandas(df, npartitions = 3)
print(ddf.head())
这会产生以下结果:
A B
0 1 2
但是,当我将 npartitions 设置为 1 或 2 时,我得到了预期的结果:
A B
0 1 2
1 2 3
2 3 4
npartitions 低于数据帧的长度似乎很重要。这是故意的吗?