我正在生成一个dask
数据框:
b = (
dask.bag.read_text(
target_files,
blocksize=None,
)
.map(_getdataframe)
.to_dataframe(schema_dataframe)
)
当前_getdataframe
返回一个dict
. 当我这样做时to_dataframe
,这些列基本上是随机顺序的。有没有办法返回一个会导致固定列顺序的对象,_getdataframe
或者在事后廉价地采用列顺序?最后的列顺序是取决于schema_dataframe
我传入的还是dict
来自的结果.map
?