问题标签 [imblearn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
444 浏览

python - Python Sklearn / Scikit & cx_freeze:模块'sklearn.tree._criterion'没有属性'Criterion'

我目前正在尝试将使用Sklearn 模块的 Python 应用程序放在独立.exe文件中。

我现在的cx_freeze setup.py样子是这样的:

它以前运行良好,但我的应用程序的最新版本使用模块 imblearn。我认为它会导致这个问题(双击.exe文件后出现几秒钟):

我查看了sklearn\tree\tree.py文件,确实有这个导入语句:

同一文件夹包含以下文件:

_criterion.cp36-win_amd64.pyd _splitter.cp36-win_amd64.pyd _tree.cp36-win_amd64.pyd _utils.cp36-win_amd64.pyd

据我所知,这是python模块文件。

如果我从PyCharm IDE执行该应用程序,它运行得非常好,所以我会假设我的程序甚至不需要Criterion 模块(并且cx_freeze只是加载它,因为它加载了所有内容),因此我没有收到错误消息运行。或者该模块实际上丢失了。

有什么想法可以解决这个问题吗?

0 投票
4 回答
13124 浏览

python - Jupyter Notebook:从 imblearn 导入 SMOTE - ImportError:无法导入名称“pairwise_distances_chunked”

我正在尝试使用库中的SMOTEimblearn

收到以下错误消息:

ImportError:无法导入名称“pairwise_distances_chunked”。

这是我下载确认的导入截图

真的很难过这一点,任何指导将不胜感激。

0 投票
1 回答
2612 浏览

python - 导入 imblearn 时的问题

我正在尝试在我的 jupyter 笔记本中导入 SMOTE。我尝试了以下步骤;

我首先在终端中使用以下命令安装了 imblearn

然后我使用以下命令在我的笔记本中导入 imblearn;

我收到以下错误;

谁能指导我?谢谢!

0 投票
0 回答
276 浏览

python - 在对测试数据集进行预测时,跳过不平衡学习管道中的一些转换步骤(与过采样和欠采样有关)

对于不平衡的分类问题,我使用 imblearn 管道和 sklearn 的 GridSearchCV(以查找最佳超参数)。管道中的步骤如下:

  1. 标准化每个功能
  2. 使用 ADASYN 采样纠正类不平衡
  3. 训练随机森林分类器

使用 GridSearchCV(连同分层 cv)在上述管道上进行超参数搜索。超参数搜索空间包括来自 ADASYN 和随机森林的超参数。

虽然上述方法非常适合在训练验证拆分期间选择最佳超参数,但我认为在预测测试数据集时应用相同的管道是错误的

原因是为了在测试数据集上进行预测,我们不应该使用 ADASYN 采样。测试数据集应按原样预测,无需任何抽样。因此,预测的管道应该是:

  1. 标准化每个功能
  2. ADASYN 采样
  3. 使用经过训练的随机森林分类器进行预测

如何使用 sklearn/imblearn API 以这种方式忽略管道中的特定转换?

我的代码(表达与上述相同的问题):

0 投票
1 回答
5394 浏览

python - python imblearn make_pipeline TypeError:Pipeline的最后一步应该实现fit

我正在尝试在管道内实现 imblearn 的 SMOTE。我的数据集是存储在 pandas 数据框中的文本数据。请看下面的代码片段

在此之后,我使用 GridsearchCV。

其中参数只不过是调整参数,主要用于 TfidfVectorizer()。我收到以下错误。

发布此错误,我已将代码更改为如下。

除了parameters调整分类器C之外什么都没有。SVC这次我收到以下错误:

这是怎么回事?有人可以帮忙吗?

0 投票
1 回答
715 浏览

python - 从 imblearn 导入 RUSBoostClassifier 的问题

我一直坚持按照这个例子导入 RUSBoostClassifier

我收到以下错误:

我不明白为什么!我可以轻松使用 imblearn 中的其他模块,例如

或者

我用的是 Jupyter notebook,Python 版本是 3.6.6。我已经更新了 sklearn 包并按照此链接重新安装了 imblearn 包。

有没有人有任何想法来解决这个问题?或者有想法在代码中直接使用这个类(源代码)?

0 投票
1 回答
182 浏览

python - 导入 imblearn.undersampling 时出错

错误

导入 imblearn_undersampling 模块时出现“no module name sklearn.cluster”错误。如图所示,从 imblearn 导入 SMOTE 时没有出错。我尝试过的一些解决方案: - 使用 conda 和 pip3 卸载并重新安装 sklearn、scikit learn、scipy - 卸载并重新安装 imblearn

0 投票
3 回答
2378 浏览

python - 如何在管道内使用 SMOTENC(错误:某些分类索引超出范围)?

如果您能告诉我如何使用 SMOTENC,我将不胜感激。我写:

因此,如前所述,我有 5 个分类特征。实际上,索引 123 到 160 与一个具有 37 个可能值的分类特征相关,这些值使用 get_dummies 转换为 37 列。不幸的是,它会引发以下错误:

提前致谢。

0 投票
1 回答
5267 浏览

python - 无法从 imblearn.over_sampling import SMOTE 导入

我已经安装了 imblearn 使用

我不断收到与 numpy 和 scipy 相关的错误,例如模块“numpy.random”没有属性“mtrand”模块“numpy.polynomial”没有属性“多项式”

np。版本 输出 [11]: '1.14.0'

scipy。版本 [17]: '1.2.1'

请让我知道如何解决这个问题

另外,我无法导入任何 sklearn 包。我试过:

对于这些,我得到 Requirement 已经是最新的

0 投票
1 回答
2807 浏览

python - 名称“RandomUnderSampler”未定义

我正在尝试使用RandomUnderSampler. 我已经正确安装了imblearn模块。但仍然收到错误:“名称'RandomUnderSampler”未定义`。这有什么具体原因吗?有人可以帮忙吗

在此处输入图像描述

实际方法名

在此处输入图像描述

这是我调用我的方法的地方 在此处输入图像描述