0

我正在尝试在我的数据集中填充缺失的数据,我的导师建议我在 Python 中使用 Fancy Impute 包,特别是 MICE 算法。首先,当我读到 MICE 时,很明显,如果我的缺失数据不是随机的,这是一个糟糕的选择(我对此表示怀疑,因为缺失数据似乎更有可能出现在特定国家/年份)。那么有人推荐不同的算法吗?(我的项目基于世界银行性别统计数据)。

技术问题:我在我的数据框上运行了这段代码:

filled = MICE().complete(dfvars)

但是我得到了这个错误,我的导师不知道它是关于什么的,而且我还没有找到任何其他讨论 python 中的 MICE 的论坛:

TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe''
4

1 回答 1

2

遇到该错误是因为 MICE 仅用于估算数字数据,如果数据集包含分类数据但您希望估算数字数据,则应仅使用数据框的数字列。如果缺少分类数据,则必须使用不同的算法。

于 2017-10-12T20:46:05.943 回答