问题标签 [imblearn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 ipython notebook 上导入 imblearn python 包的问题
我使用,和.在 windows powershell 上安装了https://github.com/glemaitre/imbalanced-learn 但是当我在 iPython 笔记本上并尝试使用以下方法导入包时:pip install
conda
github
我得到错误:
刚开始使用 Windows for Python,我是否必须将包安装在某个文件夹中?
python - 如何使用 imblearn 和 SMOTE 生成分类合成样本?
我正在寻找使用 imblearn 的 SMOTE 为机器学习算法生成合成样本。我有一些分类特征,我已使用 sklearn preprocessing.LabelEncoder 将其转换为整数。
我遇到的问题是,当我使用 smote 生成合成数据时,数据点变成浮点数,而不是分类数据所需的整数。
无论如何,我可以让 SMOTE 生成合成样本,但只能使用 0、1、2 等而不是 0.5、1.23、2.004 的值?
python - SMOTE 算法初始条件
我正在使用 python 不平衡学习包中的 SMOTE 算法:
我已经明确设置了n_neighbors = 4
. 但是,我从上面的代码中得到了以下错误:
知道为什么我的设置n_neighbors = 4
不起作用吗?
pandas - 大熊猫中多标签不平衡数据集的欠采样
我正在研究一个自己滚动的欠采样功能,因为imblearn
它不能很好地与多标签分类一起工作(例如它只接受一维y
)。
我想遍历 X 和 y,每 2 或 3 行删除一个属于多数类的行。目标是减少多数类中的行数的快速而肮脏的方法。
但即使在少量行(约 30,000 行)上,它也会使我的内核崩溃。
y
是这样的东西,在任何时候f2
或f3
在场f1
的地方,在场
因此,让我们计算 0 发生的次数f1
,然后每 3 次删除 0 行:
scikit-learn - 交叉验证管道的分类报告
我正在使用带有 SMOTE(imblearn 库)的交叉验证中的管道来检查欺诈和非欺诈客户的不平衡数据集
我能够得到混淆矩阵和 ROC 曲线,但我需要准确的精度和总召回率,我应该怎么做呢?
编辑
我知道 scikit-learn 中有分类报告,但我如何将它用于 CV 中的预测?
python - 如何在imblearn中使用ratio ='dict'的随机欠采样器?
我正在尝试使用 imblearn 的random under-sampler处理不平衡的数据集。我想手动指定要欠采样的标签数量。这是我的代码:
但是,这会引发错误:
文件“first_approach.py”,第 56 行,在 <module> X_train, y_train = sm.fit_sample(X_tr,encoded_Ytrain) raise ValueError('Unknown parameter type for ratio.') ValueError: Unknown parameter type for ratio。
传递相同的正确语法应该是什么?
python - 使用 imblearn 对多类数据进行过采样
我想使用不平衡学习模块中的RandomOverSampler函数来对具有两个以上类的数据进行过采样。以下是我的 3 个类的代码:
运行后,它返回此警告:
UserWarning:目标类型应该是二进制。warnings.warn('目标类型应该是二进制的。')
但是文档说:
笔记
支持多类重采样。
我是否缺少将其用于多类案例的东西?如果这仅适用于二进制类,是否还有其他支持多类过采样的库或模块?
python - 使用不平衡学习库的特征重要性
imblearn库是用于不平衡分类的库。它允许您在使用scikit-learn
各种方法平衡类的同时使用估计器,从欠采样到过采样再到集成。
BalancedBaggingClassifier
但是,我的问题是,在使用imblearn 或任何其他采样方法后,如何获得估计器的特征重要性?
python - 在 Jupyter 中和从命令行导入 imblearn 时出错
我尝试以这种方式从 imblearn 导入 SMOTE:
我正在使用 Jupyter Notebooks,但因为我有 Windows,所以我无法使用 Jupyter 附带的终端。我有 anaconda 所以在我写的 anaconda 提示符下:
之后,我升级了 sklearn (因为我有一个错误):
升级和安装在 Anaconda 提示符下运行良好。
但是后来我的笔记本上出现了另一个错误:
我认为,这是 sklearn 中无法导入的元素
我不知道我是否做错了什么......或者我能做些什么。谢谢!
python-3.x - Jupyter:安装后没有名为“imblearn”的模块
我在 ANACONDA Navigator 上安装了“不平衡学习”(版本 0.3.1)。当我使用 Jupyter (Python 3) 从不平衡学习网站运行一个示例时,我收到一条关于“ModuleNotFoundError”的消息。没有名为“imblearn”的模块。
我该如何解决这个问题?