问题标签 [fancyimpute]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
285 浏览

visual-studio-2015 - 如何点安装fancyimpute?

就我而言,我也有 python 3.7.7 但也无法安装 fancyimpute 我尝试了 cp36 和 cp37 版本。我已经安装了 Visual Studio C++ 2015

这是我的错误日志。

错误:需要 Microsoft Visual C++ 14.0。使用“Visual Studio 构建工具”获取它:https ://visualstudio.microsoft.com/downloads/


错误:为 scs 构建轮子失败 为 scs 运行 setup.py clean 无法构建 cvxpy scs 错误:无法为使用 PEP 517 且无法直接安装的 cvxpy 构建轮子

0 投票
1 回答
315 浏览

python-3.x - 使用 fancyimpute 对测试集进行软估算

python 包fancyimpute提供了几种数据插补方法。我尝试使用软估算方法;但是,软估算不提供用于测试数据集的转换方法。更准确地说,Sklearn SimpleImputer(如下所示)提供了 fit、transform 和 fit_transform 方法。另一方面,SoftImpute 提供了唯一的 fit_transform,它允许我在训练中拟合数据,但不能将其转换为测试集。我知道在训练集和测试集上进行插补会导致数据从测试集泄漏到训练中。为此,我们需要在训练上适应,在测试上转型。有什么方法可以将我从训练集中拟合的测试集以软估算方法进行估算?我很感激任何想法。

0 投票
0 回答
114 浏览

python-3.x - 执行 KNN 插补后出现属性错误

这是代码

我收到了这个错误:

然后我用这个:

但得到了这个错误

0 投票
0 回答
626 浏览

sklearn-pandas - 我可以使用 sklearn IterativeImputer 来填写缺失的分类数据吗?

我有一个分类和连续特征的数据集,其中很多都缺少元素。我想知道我是否可以使用相应的 imputer 来填写连续数据和分类数据。

如果不能完成,最好的方法是什么?最好将数据分成连续特征和离散特征,然后使用例如 IterativeImputer 用于第一组,KNN 用于第二组,然后合并它们?

任何帮助,将不胜感激。

数据包含 65 个特征:

我已经标准化了连续变量。有许多分类特征,如 'painloc' 和 'painexer' 有缺失值,还有一些连续特征,如 'age' (我决定将其视为连续的)和 'chol' 也有缺失元素。

我尝试使用 IterativeImputer:

它适用于连续特征,但不适用于分类,因为它可以填写十进制数字,这显然是不对的。

0 投票
1 回答
100 浏览

numpy - from fancyimpute import KNN: AttributeError: 'KNN' object has no attribute 'fit_transform'

python新手,这是我的第一个问题。

系统信息:Windows 7,python 3.8.9,尚未使用 virtualenv。

我想fancyimpute在我的数据帧(null_dataframe_constant)中使用模块中的插补技术。

尝试使用 fancyimpute 模块需要 tensorflow 以及 numpy 1.20.0 版本或最新版本。但是 tensorflow 2.4.1(当前最新版本)需要 numpy 1.19.2 或以前的版本。

当使用 numpy 1.19.2 并导入 fancyimpute 时,它​​会抛出

使用 numpy 1.20.2 时,fancyimpute 似乎可以工作,但运行下面的脚本会引发错误。

有任何想法吗?

我已经安装了这些模块版本:

0 投票
1 回答
83 浏览

python - 当我将 IterativeImputer 与 KNeighborsClassifier 一起使用时出现错误“未知标签类型:'连续'”

我想用 IterativeImputer 进行多重插补。

这是数据集(原始数据来自https://www.kaggle.com/jboysen/mri-and-alzheimers):

alz_df_imp_categorical

要估算的变量是“educ”和“ses”。由于它们是分类的,我选择使用分类器(来自 sklearn 的 KNeighborsClassifier)。预测变量是连续的(“性别”除外)。

这是代码:

错误是:

“未知标签类型:'连续'”

实际上,fit_transform() 函数将数据帧转换为数组,所有变量都转换为浮点类型。因此,由于这种数组转换,要预测的变量不再是分类的。此外,数组中只接受一种类型的变量(因此,我不能只将变量转换为分类预测而让其他变量浮动)。因此,由于目标变量是浮动的,分类器无法工作。所以,我理解错误......但我不知道如何解决它。

我认为,当 KNN 分类器是多种类型的预测器(连续和分类)时,我们可能无法应用它们。但是,当我在 R 中使用 KNN 分类器时,我对此没有任何问题。

你有一些想法来解决这个问题吗?

谢谢你。