我正在生成一个dask数据框:
b = (
dask.bag.read_text(
target_files,
blocksize=None,
)
.map(_getdataframe)
.to_dataframe(schema_dataframe)
)
当前_getdataframe返回一个dict. 当我这样做时to_dataframe,这些列基本上是随机顺序的。有没有办法返回一个会导致固定列顺序的对象,_getdataframe或者在事后廉价地采用列顺序?最后的列顺序是取决于schema_dataframe我传入的还是dict来自的结果.map?