我正在处理一个属性中存在多个缺失值的数据集。
完成数据预处理的典型过程后,我的下一步是尝试拟合回归模型来估算缺失值。但是,当我尝试使用IterativeImputer
from 时fancyimpute
。我遇到了这个错误:
C:\Users\User.DC241-12\Anaconda3\lib\site-packages\sklearn\linear_model\ridge.py:942: RuntimeWarning: overflow encountered in square
v = s ** 2
****hierarchy of filenames in which error is happening****
Input contains NaN, infinity or a value too large for dtype('float64')
我知道输入到的缺失值IterativeImputer
将表示为NaN
s 所以我猜这不是这里的原因。在传递到插补过程之前,我是否应该将我的数据缩放到。但这不会影响插补过程吗?
谢谢!