问题标签 [imblearn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Sklearn / Scikit & cx_freeze:模块'sklearn.tree._criterion'没有属性'Criterion'
我目前正在尝试将使用Sklearn 模块的 Python 应用程序放在独立.exe
文件中。
我现在的cx_freeze
setup.py
样子是这样的:
它以前运行良好,但我的应用程序的最新版本使用模块 imblearn。我认为它会导致这个问题(双击.exe
文件后出现几秒钟):
我查看了sklearn\tree\tree.py
文件,确实有这个导入语句:
同一文件夹包含以下文件:
_criterion.cp36-win_amd64.pyd
_splitter.cp36-win_amd64.pyd
_tree.cp36-win_amd64.pyd
_utils.cp36-win_amd64.pyd
据我所知,这是python模块文件。
如果我从PyCharm IDE执行该应用程序,它运行得非常好,所以我会假设我的程序甚至不需要Criterion 模块(并且cx_freeze
只是加载它,因为它加载了所有内容),因此我没有收到错误消息运行。或者该模块实际上丢失了。
有什么想法可以解决这个问题吗?
python - Jupyter Notebook:从 imblearn 导入 SMOTE - ImportError:无法导入名称“pairwise_distances_chunked”
我正在尝试使用库中的SMOTE
包imblearn
:
收到以下错误消息:
ImportError:无法导入名称“pairwise_distances_chunked”。
这是我下载确认的导入截图
真的很难过这一点,任何指导将不胜感激。
python - 导入 imblearn 时的问题
我正在尝试在我的 jupyter 笔记本中导入 SMOTE。我尝试了以下步骤;
我首先在终端中使用以下命令安装了 imblearn
然后我使用以下命令在我的笔记本中导入 imblearn;
我收到以下错误;
谁能指导我?谢谢!
python - 在对测试数据集进行预测时,跳过不平衡学习管道中的一些转换步骤(与过采样和欠采样有关)
对于不平衡的分类问题,我使用 imblearn 管道和 sklearn 的 GridSearchCV(以查找最佳超参数)。管道中的步骤如下:
- 标准化每个功能
- 使用 ADASYN 采样纠正类不平衡
- 训练随机森林分类器
使用 GridSearchCV(连同分层 cv)在上述管道上进行超参数搜索。超参数搜索空间包括来自 ADASYN 和随机森林的超参数。
虽然上述方法非常适合在训练验证拆分期间选择最佳超参数,但我认为在预测测试数据集时应用相同的管道是错误的。
原因是为了在测试数据集上进行预测,我们不应该使用 ADASYN 采样。测试数据集应按原样预测,无需任何抽样。因此,预测的管道应该是:
- 标准化每个功能
ADASYN 采样- 使用经过训练的随机森林分类器进行预测
如何使用 sklearn/imblearn API 以这种方式忽略管道中的特定转换?
我的代码(表达与上述相同的问题):
python - python imblearn make_pipeline TypeError:Pipeline的最后一步应该实现fit
我正在尝试在管道内实现 imblearn 的 SMOTE。我的数据集是存储在 pandas 数据框中的文本数据。请看下面的代码片段
在此之后,我使用 GridsearchCV。
其中参数只不过是调整参数,主要用于 TfidfVectorizer()。我收到以下错误。
发布此错误,我已将代码更改为如下。
除了parameters
调整分类器C
之外什么都没有。SVC
这次我收到以下错误:
这是怎么回事?有人可以帮忙吗?
python - 从 imblearn 导入 RUSBoostClassifier 的问题
我一直坚持按照这个例子导入 RUSBoostClassifier
我收到以下错误:
我不明白为什么!我可以轻松使用 imblearn 中的其他模块,例如
或者
我用的是 Jupyter notebook,Python 版本是 3.6.6。我已经更新了 sklearn 包并按照此链接重新安装了 imblearn 包。
有没有人有任何想法来解决这个问题?或者有想法在代码中直接使用这个类(源代码)?
python - 如何在管道内使用 SMOTENC(错误:某些分类索引超出范围)?
如果您能告诉我如何使用 SMOTENC,我将不胜感激。我写:
因此,如前所述,我有 5 个分类特征。实际上,索引 123 到 160 与一个具有 37 个可能值的分类特征相关,这些值使用 get_dummies 转换为 37 列。不幸的是,它会引发以下错误:
提前致谢。
python - 无法从 imblearn.over_sampling import SMOTE 导入
我已经安装了 imblearn 使用
我不断收到与 numpy 和 scipy 相关的错误,例如模块“numpy.random”没有属性“mtrand”模块“numpy.polynomial”没有属性“多项式”
np。版本 输出 [11]: '1.14.0'
scipy。版本 [17]: '1.2.1'
请让我知道如何解决这个问题
另外,我无法导入任何 sklearn 包。我试过:
对于这些,我得到 Requirement 已经是最新的