我正在尝试将 item_price 的 nan 值更改为基于以下 dask 数据框中的 item_id 的平均值:
all_data['item_price'] = all_data[['item_id','item_price']].groupby('item_id')['item_price'].apply(lambda x: x.fillna(x.mean()))
All_data.head()
不幸的是,我收到以下错误:
ValueError: cannot reindex from a duplicate axis
知道如何避免此错误或以任何其他方式将 nan 值更改为 dask 数据帧的平均值吗?