问题标签 [smote]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
176 浏览

python - 导入 SMOTE 时出现不平衡学习模块 base.py 文件语法错误

我使用(Python 2.7)安装了不平衡学习包:

安装后,我尝试从包中导入 SMOTE。

这给出了以下错误:

谁能帮我解决这个错误或指出我是否没有正确安装软件包?

0 投票
0 回答
28 浏览

python - 如何在 python smote_variants model_selection 中添加 ANN?

我正在使用 python 库 smote-variants ( https://pypi.org/project/smote-variants/ ),我想使用方法 model_selection 来选择最佳分类器和最佳重采样方法。我这样做是这样的:

诸如 KNN 或 RandomForestClassifier 之类的分类器可以作为分类器列表包含在 sv.model_selection() 中,但是如果我想包含一个 ANN 实现怎么办?我该怎么做?有办法吗?

0 投票
1 回答
8062 浏览

oversampling - TypeError: __init__() 在使用 SMOTE 时得到了一个意外的关键字参数 'ratio'

由于我的数据集不平衡,我正在使用 SMOTE 进行过采样。我收到一个意外的参数错误。但在文档中,该ratio参数是为 SMOTE 定义的。有人可以帮助我了解我哪里出错了吗?

代码片段

错误

0 投票
0 回答
122 浏览

python - Python - 如何区分 SMOTE 重采样与原始数据

我使用 SMOTE 对数据进行过度采样,如下所示:

所以现在X_resampled, y_resampled都比原始数据集大。如何区分合成样本中的原始数据?

0 投票
0 回答
230 浏览

python - Google Colab 错误 - SMOTE() 更改列名称(功能名称)

我正在做一个二进制分类,为了平衡我的数据集,我在 python 中实现了 sklearn 的 SMOTE()。

在我的本地笔记本电脑中,一切运行良好,但是当我在 Google Colab 中运行它时,出现以下错误:

'''IndexError: 只有整数、切片 ( :)、省略号 ( ...)、numpy.newaxis ( None) 和整数或布尔数组是有效的索引'''

在 X_train_new 变量的计算中:

我的代码如下:

我保存了 X_train 和 y_train 以检测初始 X_train 和使用 SMOTE 计算的 X_trains 之间的差异。我发现在 Google Colab 中我得到以下文件(一个示例):

在我的笔记本电脑中,我得到:

为什么不同的机器保存列表的方式不同?

0 投票
1 回答
1011 浏览

machine-learning - 在数据不平衡的管道中进行交叉验证的正确方法

对于给定的不平衡数据,我创建了一个不同的标准化管道和一个热编码

之后,一个柱式变压器将上述管道保持在一个

最终管道如下

我正在对不平衡数据进行管道拟合,因此我将 SMOTE 技术与预处理和分类器一起包括在内。由于不平衡,我想检查召回分数。

正确的方法如下面的代码所示吗?我正在召回 0.98 左右,这可能会导致模型过度拟合。如果我犯了任何错误,有什么建议吗?

0 投票
1 回答
63 浏览

python - 如何在 SMOTE(imblearn 模块)之后提取新添加的行

是否可以从 imblearn 的 smote 函数创建的 pandas 数据框中提取新添加的行?

0 投票
0 回答
341 浏览

python - 如何将 SMOTENC 应用于包含对象和数字列的数据框?

我一直在尝试将列组合包含在 categorical_features 参数中,但它们都不起作用。我的数据名声中也没有空值。我使用 Smotenc 的原因是因为我的目标向量非常倾斜:99.7% 是,0.3% 不是。请帮忙。

0 投票
1 回答
475 浏览

machine-learning - 忽略 SMOTE 过采样中的列

我有六个特征列和一个目标列,这是不平衡的。我可以通过复制与常量完全相同的内容(月、年列)仅为 X1、X2、X3、X4 四个列创建合成记录,从而制作像 ADASYN 或 SMOTE 这样的过采样方法

当前之一:

在此处输入图像描述

预期一:它可以通过对目标类'1'进行上采样来创建合成记录,但是记录的数量可以增加,但添加的记录应该有月份和年份(不变,如下所示)

在此处输入图像描述

0 投票
0 回答
254 浏览

python - 实施 SMOTE 时出现 validate_data 错误

我正在使用 SMOTE 对我的不平衡数据集进行过采样,并不断遇到

AttributeError: 'SMOTE' object has no attribute '_validate_data'

我的示例数据框和代码就是这样

我尝试将 SMOTE 实例化改为采用sampling_strategy浮点数

但错误仍然存​​在。