问题标签 [smote]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 导入 SMOTE 时出现不平衡学习模块 base.py 文件语法错误
我使用(Python 2.7)安装了不平衡学习包:
安装后,我尝试从包中导入 SMOTE。
这给出了以下错误:
谁能帮我解决这个错误或指出我是否没有正确安装软件包?
python - 如何在 python smote_variants model_selection 中添加 ANN?
我正在使用 python 库 smote-variants ( https://pypi.org/project/smote-variants/ ),我想使用方法 model_selection 来选择最佳分类器和最佳重采样方法。我这样做是这样的:
诸如 KNN 或 RandomForestClassifier 之类的分类器可以作为分类器列表包含在 sv.model_selection() 中,但是如果我想包含一个 ANN 实现怎么办?我该怎么做?有办法吗?
oversampling - TypeError: __init__() 在使用 SMOTE 时得到了一个意外的关键字参数 'ratio'
由于我的数据集不平衡,我正在使用 SMOTE 进行过采样。我收到一个意外的参数错误。但在文档中,该ratio
参数是为 SMOTE 定义的。有人可以帮助我了解我哪里出错了吗?
代码片段
错误
python - Python - 如何区分 SMOTE 重采样与原始数据
我使用 SMOTE 对数据进行过度采样,如下所示:
所以现在X_resampled, y_resampled
都比原始数据集大。如何区分合成样本中的原始数据?
python - Google Colab 错误 - SMOTE() 更改列名称(功能名称)
我正在做一个二进制分类,为了平衡我的数据集,我在 python 中实现了 sklearn 的 SMOTE()。
在我的本地笔记本电脑中,一切运行良好,但是当我在 Google Colab 中运行它时,出现以下错误:
'''IndexError: 只有整数、切片 ( :
)、省略号 ( ...
)、numpy.newaxis ( None
) 和整数或布尔数组是有效的索引'''
在 X_train_new 变量的计算中:
我的代码如下:
我保存了 X_train 和 y_train 以检测初始 X_train 和使用 SMOTE 计算的 X_trains 之间的差异。我发现在 Google Colab 中我得到以下文件(一个示例):
在我的笔记本电脑中,我得到:
为什么不同的机器保存列表的方式不同?
machine-learning - 在数据不平衡的管道中进行交叉验证的正确方法
对于给定的不平衡数据,我创建了一个不同的标准化管道和一个热编码
之后,一个柱式变压器将上述管道保持在一个
最终管道如下
我正在对不平衡数据进行管道拟合,因此我将 SMOTE 技术与预处理和分类器一起包括在内。由于不平衡,我想检查召回分数。
正确的方法如下面的代码所示吗?我正在召回 0.98 左右,这可能会导致模型过度拟合。如果我犯了任何错误,有什么建议吗?
python - 如何在 SMOTE(imblearn 模块)之后提取新添加的行
是否可以从 imblearn 的 smote 函数创建的 pandas 数据框中提取新添加的行?
python - 如何将 SMOTENC 应用于包含对象和数字列的数据框?
我一直在尝试将列组合包含在 categorical_features 参数中,但它们都不起作用。我的数据名声中也没有空值。我使用 Smotenc 的原因是因为我的目标向量非常倾斜:99.7% 是,0.3% 不是。请帮忙。
python - 实施 SMOTE 时出现 validate_data 错误
我正在使用 SMOTE 对我的不平衡数据集进行过采样,并不断遇到
AttributeError: 'SMOTE' object has no attribute '_validate_data'
我的示例数据框和代码就是这样
我尝试将 SMOTE 实例化改为采用sampling_strategy
浮点数
但错误仍然存在。