0

我正在尝试将预测的缺失值插入原始 df (当然是缺失值的列)。我怎么能这样做?

预测的缺失值基本上存储在一个列表/系列中,其长度是原始df中缺失值的数量。我认为列表中的顺序与缺失值出现在 df 中的顺序相匹配,因为我在缺失的系列中使用 nonull() 将 test_set 从 df 中拆分出来。

我一直在尝试pd.Series.fillna,但这只允许替换一个值。

4

1 回答 1

0

您可以使用 numpy where和 pandas isnull函数来做到这一点。

df['relevant_column'] = np.where(df['relevant_column'].isnull(),
                                 predicted_values,
                                 df['relevant_column'])

predict_values 应该是与数据帧具有相同长度的 pandas 系列或 1d numpy 数组。

于 2018-04-05T15:29:20.297 回答