问题标签 [imblearn]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

156 问题

0 投票

7 回答

62347 浏览

python - 在 ipython notebook 上导入 imblearn python 包的问题

我使用,和.在 windows powershell 上安装了https://github.com/glemaitre/imbalanced-learn 但是当我在 iPython 笔记本上并尝试使用以下方法导入包时：pip installcondagithub

我得到错误：

刚开始使用 Windows for Python，我是否必须将包安装在某个文件夹中？

2016-10-12T20:42:45.797

0 投票

2 回答

2159 浏览

python - 如何使用 imblearn 和 SMOTE 生成分类合成样本？

我正在寻找使用 imblearn 的 SMOTE 为机器学习算法生成合成样本。我有一些分类特征，我已使用 sklearn preprocessing.LabelEncoder 将其转换为整数。

我遇到的问题是，当我使用 smote 生成合成数据时，数据点变成浮点数，而不是分类数据所需的整数。

无论如何，我可以让 SMOTE 生成合成样本，但只能使用 0、1、2 等而不是 0.5、1.23、2.004 的值？

python python-3.x scikit-learn imblearn

2016-11-14T01:18:09.700

0 投票

1 回答

1828 浏览

python - SMOTE 算法初始条件

我正在使用 python 不平衡学习包中的 SMOTE 算法：

我已经明确设置了n_neighbors = 4. 但是，我从上面的代码中得到了以下错误：

知道为什么我的设置n_neighbors = 4不起作用吗？

python machine-learning classification imblearn

2016-12-18T05:30:58.783

0 投票

0 回答

1012 浏览

pandas - 大熊猫中多标签不平衡数据集的欠采样

我正在研究一个自己滚动的欠采样功能，因为imblearn它不能很好地与多标签分类一起工作（例如它只接受一维y）。

我想遍历 X 和 y，每 2 或 3 行删除一个属于多数类的行。目标是减少多数类中的行数的快速而肮脏的方法。

但即使在少量行（约 30,000 行）上，它也会使我的内核崩溃。

y是这样的东西，在任何时候f2或f3在场f1的地方，在场

因此，让我们计算 0 发生的次数f1，然后每 3 次删除 0 行：

pandas data-science imblearn

2017-05-31T19:51:59.977

0 投票

1 回答

2063 浏览

scikit-learn - 交叉验证管道的分类报告

我正在使用带有 SMOTE（imblearn 库）的交叉验证中的管道来检查欺诈和非欺诈客户的不平衡数据集

我能够得到混淆矩阵和 ROC 曲线，但我需要准确的精度和总召回率，我应该怎么做呢？

编辑

我知道 scikit-learn 中有分类报告，但我如何将它用于 CV 中的预测？

scikit-learn cross-validation confusion-matrix precision-recall imblearn

2017-06-14T11:06:26.933

0 投票

2 回答

1534 浏览

python - 如何在imblearn中使用ratio ='dict'的随机欠采样器？

我正在尝试使用 imblearn 的random under-sampler处理不平衡的数据集。我想手动指定要欠采样的标签数量。这是我的代码：

但是，这会引发错误：

文件“first_approach.py”，第 56 行，在 <module> X_train, y_train = sm.fit_sample(X_tr,encoded_Ytrain) raise ValueError('Unknown parameter type for ratio.') ValueError: Unknown parameter type for ratio。

传递相同的正确语法应该是什么？

python python-3.x syntax syntax-error imblearn

2017-06-23T15:18:18.123

0 投票

3 回答

4388 浏览

python - 使用 imblearn 对多类数据进行过采样

我想使用不平衡学习模块中的RandomOverSampler函数来对具有两个以上类的数据进行过采样。以下是我的 3 个类的代码：

运行后，它返回此警告：

UserWarning：目标类型应该是二进制。warnings.warn('目标类型应该是二进制的。')

但是文档说：

笔记

支持多类重采样。

我是否缺少将其用于多类案例的东西？如果这仅适用于二进制类，是否还有其他支持多类过采样的库或模块？

python scikit-learn imblearn

2017-08-06T00:06:17.870

0 投票

3 回答

1950 浏览

python - 使用不平衡学习库的特征重要性

imblearn库是用于不平衡分类的库。它允许您在使用scikit-learn各种方法平衡类的同时使用估计器，从欠采样到过采样再到集成。

BalancedBaggingClassifier但是，我的问题是，在使用imblearn 或任何其他采样方法后，如何获得估计器的特征重要性？

python scikit-learn classification random-forest imblearn

2017-09-18T16:25:41.687

0 投票

0 回答

1928 浏览

python - 在 Jupyter 中和从命令行导入 imblearn 时出错

我尝试以这种方式从 imblearn 导入 SMOTE：

我正在使用 Jupyter Notebooks，但因为我有 Windows，所以我无法使用 Jupyter 附带的终端。我有 anaconda 所以在我写的 anaconda 提示符下：

之后，我升级了 sklearn （因为我有一个错误）：

升级和安装在 Anaconda 提示符下运行良好。

但是后来我的笔记本上出现了另一个错误：

我认为，这是 sklearn 中无法导入的元素

我不知道我是否做错了什么......或者我能做些什么。谢谢！

python anaconda jupyter-notebook importerror imblearn

2017-10-18T16:12:53.387

0 投票

12 回答

67597 浏览

python-3.x - Jupyter：安装后没有名为“imblearn”的模块

我在 ANACONDA Navigator 上安装了“不平衡学习”（版本 0.3.1）。当我使用 Jupyter (Python 3) 从不平衡学习网站运行一个示例时，我收到一条关于“ModuleNotFoundError”的消息。没有名为“imblearn”的模块。

我该如何解决这个问题？

python-3.x anaconda imblearn

2017-12-02T10:25:23.693

1 2 3 4 5 6 7 8 9 10

问题标签 [imblearn]

Reference