0

从各种资源中,我了解到使用期望最大化方法进行插补优于使用平均插补来插补缺失数据。但是没有消息来源解释如何在 python 中实现它。

我查看了scikit-learnfancyimpute包,但他们没有提到任何关于期望最大化方法的内容。

如果您可以提供文档链接以解释实现的示例,或者提供代码来实现缺失数据的期望最大化方法,这将非常有帮助。

4

1 回答 1

1
import impyute as impy

data_missing = pd.DataFrame(np.array([[np.NaN, 0.6, np.NaN], [np.NaN, 0.25, 
0.3], [0.6, 0.7, np.NaN]]), columns=['a', 'b', 'c'])
em_imputed = impy.em(data_missing)

output:
   a     b    c
0  0.6  0.60  0.3
1  0.6  0.25  0.3
2  0.6  0.70  0.3

em 函数将返回数据帧类型

于 2020-09-15T03:25:29.660 回答