问题标签 [rfe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
249 浏览

r - 在一个图中绘制多个插入符号的 RFE 结果

我使用了插入符号的 RFE 算法,以 ROC 作为指标,并希望绘制结果。这很好用,但现在我想将两个结果放在一个图中,我不确定是否有一个简单的解决方案,或者这是否可能。如果这是一个愚蠢的问题,我很抱歉,在 R 中不太先进。有解决方案吗?

这是我的代码:

从代码生成的正态图: 从代码生成的绘图

0 投票
1 回答
450 浏览

python - RFECV 与 GridSearchCV 的评分有什么区别?

我正在尝试运行 RFECV 来选择最佳功能,并运行 GridSearchCV 来获得最佳超参数。我的代码如下所示:

当我在 GridSearchCV 中包含相同的评分指标时,我会从 cv_results 中获得不同的最佳特征、n_features 和参数。为什么会发生这种情况,哪些方法是正确的?

0 投票
1 回答
650 浏览

python - 使用分类数据进行回归时发现未知类别

我用 ScikitLearn 和 Python 做线性回归。我的数据有分类值,所以我使用了编码。

我想找到最优的特征数量,所以我使用了RFE

但是当我这样做时,我得到了这个错误:

我究竟做错了什么?我知道问题在于转型,但我不知道我做错了什么。

0 投票
2 回答
2591 浏览

python - RFECV 机器学习特征选择耗时太长 Python

我对 SKLearn 比较陌生,并且有一个关于特征选择的问题。

我正在尝试构建一个 SVM 模型,我的数据具有大约 30 个特征,所有大约 10k 数据点,我目前正在尝试尽可能多地消除无用的特征。我首先删除了与其他功能高度相关的功能,现在想使用 RFECV 来优化剩余的功能。

首先,我在 sklearn 网站上找到了这段代码,我遇到了一些问题,想知道是否有人可以提供帮助。

首先,如果我按原样运行它,它需要永远运行,我已经离开它很长时间了,我还没有真正设法让它完成。但是,如果我删除kernel='linear'它运行得相当快,但随后会产生一条错误消息,该消息似乎来自rfe.fit(X, y)

RuntimeError: The classifier does not expose "coef_" or "feature_importances_" attributes

我已经将我的功能减少到大约 10 个,只是为了看看我是否可以加快速度作为测试,并且还使用了step变量,但是那里的kernel='linear'变量似乎没有任何帮助加速它,它只是运行几个小时什么都不做。我想要的只是使用 RFECV 方法使用的功能列表。有没有人对我做错了什么或我可以做些什么来加快速度有什么建议?

非常感谢

0 投票
0 回答
37 浏览

machine-learning - 使用交叉验证的递归特征消除

我不知道为什么随着功能数量的增加,准确性会降低?

下图是sklearn的例子,它表明,如果我们使用超过(顶部)3个特征,我们不仅会提高准确率,反而会降低准确率![H] 2 谁能解释一下或提供一些参考?

0 投票
1 回答
171 浏览

machine-learning - GPU 上的 SKLearn RFE(递归特征消除)

我想知道是否支持通过 GPU 执行 RFE 从我在 sklearn 站点中检查的内容来看,我找不到任何文档,因此,我认为没有官方支持。[ https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFE.html]

如果有一些指向官方支持或任何学术/非学术尝试的指针,将不胜感激。

0 投票
1 回答
967 浏览

scikit-learn - 与 RFECV 结合时如何在 Gridsearch 中使用“max_features”?

感谢您提前回答。这是我的第一篇文章,我对 python 比较陌生,所以如果我格式化了一些可怕的东西,我深表歉意。

我试图在 sklearn 中结合递归特征消除和网格搜索来确定超参数和特征数量的最佳组合。使用下面的代码时,我得到max_features must be in (0, n_features] Estimator fit failed. for any other than max_features is 1. 我的数据集中有 300 多个特征,其中许多可能不重要。

'''

'''

0 投票
1 回答
529 浏览

machine-learning - 如何使用递归特征消除?

我是 ML 新手,一直在尝试使用 RFE 方法进行特征选择。我的数据集有 5K 条记录及其二进制分类问题。这是我根据在线教程遵循的代码

我遇到以下错误。有人可以帮忙吗

0 投票
0 回答
71 浏览

r - R RFE 函数不适用于不同的数据集

错误信息:

quantile.default(y, probs = seq(0, 1, length = cut)) 中的错误:如果 'na.rm' 为 FALSE,则不允许缺少值和 NaN

0 投票
1 回答
3160 浏览

python - What does the high VIF for the constant term (intercept) indicate?

I am building a Linear regression model on a car dataset using RFE technique and statsmodels library. My final model has p-value well within 5% and has high F-statistics. VIF values for the predictor variables are well below 5 but for the constant term(intercept) VIF is 8.18. I have used add_constant method to add constant to the model. Following are my doubts:

  1. What does High variance for the constant indicate ?
  2. Should i ignore the constant term while calculating VIF?

These are my results:

This is the summary of my final model

VIF results for the model

I am new to machine learning and also posting question on this site for the 1st time. Kindly let me know if any more information is needed to answer my question.