问题标签 [imblearn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
62347 浏览

python - 在 ipython notebook 上导入 imblearn python 包的问题

我使用,和.在 windows powershell 上安装了https://github.com/glemaitre/imbalanced-learn 但是当我在 iPython 笔记本上并尝试使用以下方法导入包时:pip installcondagithub

我得到错误:


刚开始使用 Windows for Python,我是否必须将包安装在某个文件夹中?

0 投票
2 回答
2159 浏览

python - 如何使用 imblearn 和 SMOTE 生成分类合成样本?

我正在寻找使用 imblearn 的 SMOTE 为机器学习算法生成合成样本。我有一些分类特征,我已使用 sklearn preprocessing.LabelEncoder 将其转换为整数。

我遇到的问题是,当我使用 smote 生成合成数据时,数据点变成浮点数,而不是分类数据所需的整数。

无论如何,我可以让 SMOTE 生成合成样本,但只能使用 0、1、2 等而不是 0.5、1.23、2.004 的值?

0 投票
1 回答
1828 浏览

python - SMOTE 算法初始条件

我正在使用 python 不平衡学习包中的 SMOTE 算法:

我已经明确设置了n_neighbors = 4. 但是,我从上面的代码中得到了以下错误:


知道为什么我的设置n_neighbors = 4不起作用吗?

0 投票
0 回答
1012 浏览

pandas - 大熊猫中多标签不平衡数据集的欠采样

我正在研究一个自己滚动的欠采样功能,因为imblearn它不能很好地与多标签分类一起工作(例如它只接受一维y)。

我想遍历 X 和 y,每 2 或 3 行删除一个属于多数类的行。目标是减少多数类中的行数的快速而肮脏的方法。

但即使在少量行(约 30,000 行)上,它也会使我的内核崩溃。

y是这样的东西,在任何时候f2f3在场f1的地方,在场

因此,让我们计算 0 发生的次数f1,然后每 3 次删除 0 行:

0 投票
1 回答
2063 浏览

scikit-learn - 交叉验证管道的分类报告

我正在使用带有 SMOTE(imblearn 库)的交叉验证中的管道来检查欺诈和非欺诈客户的不平衡数据集

我能够得到混淆矩阵和 ROC 曲线,但我需要准确的精度和总召回率,我应该怎么做呢?

编辑

我知道 scikit-learn 中有分类报告,但我如何将它用于 CV 中的预测?

0 投票
2 回答
1534 浏览

python - 如何在imblearn中使用ratio ='dict'的随机欠采样器?

我正在尝试使用 imblearn 的random under-sampler处理不平衡的数据集。我想手动指定要欠采样的标签数量。这是我的代码:

但是,这会引发错误:

文件“first_approach.py​​”,第 56 行,在 <module> X_train, y_train = sm.fit_sample(X_tr,encoded_Ytrain) raise ValueError('Unknown parameter type for ratio.') ValueError: Unknown parameter type for ratio。

传递相同的正确语法应该是什么?

0 投票
3 回答
4388 浏览

python - 使用 imblearn 对多类数据进行过采样

我想使用不平衡学习模块中的RandomOverSampler函数来对具有两个以上类的数据进行过采样。以下是我的 3 个类的代码:

运行后,它返回此警告:

UserWarning:目标类型应该是二进制。warnings.warn('目标类型应该是二进制的。')

但是文档说:

笔记

支持多类重采样。

我是否缺少将其用于多类案例的东西?如果这仅适用于二进制类,是否还有其他支持多类过采样的库或模块?

0 投票
3 回答
1950 浏览

python - 使用不平衡学习库的特征重要性

imblearn库是用于不平衡分类的库。它允许您在使用scikit-learn各种方法平衡类的同时使用估计器,从欠采样到过采样再到集成。

BalancedBaggingClassifier但是,我的问题是,在使用imblearn 或任何其他采样方法后,如何获得估计器的特征重要性?

0 投票
0 回答
1928 浏览

python - 在 Jupyter 中和从命令行导入 imblearn 时出错

我尝试以这种方式从 imblearn 导入 SMOTE:

我正在使用 Jupyter Notebooks,但因为我有 Windows,所以我无法使用 Jupyter 附带的终端。我有 anaconda 所以在我写的 anaconda 提示符下:

之后,我升级了 sklearn (因为我有一个错误):

升级和安装在 Anaconda 提示符下运行良好。

但是后来我的笔记本上出现了另一个错误:

我认为,这是 sklearn 中无法导入的元素

我不知道我是否做错了什么......或者我能做些什么。谢谢!

0 投票
12 回答
67597 浏览

python-3.x - Jupyter:安装后没有名为“imblearn”的模块

我在 ANACONDA Navigator 上安装了“不平衡学习”(版本 0.3.1)。当我使用 Jupyter (Python 3) 从不平衡学习网站运行一个示例时,我收到一条关于“ModuleNotFoundError”的消息。没有名为“imblearn”的模块。

我该如何解决这个问题?