问题标签 [rfe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
39 浏览

r - 实施 SVM RFE 并且找不到库

我正在寻找设置 SVM RFE 并在此处找到 SO 文章:在 R 中实现 SVM-RFE 算法

似乎代码中的 SVM 函数与 e1071 库中的函数不同,我一直在四处寻找具有上述文章中引用的函数的库,但没有运气。上面链接的示例中的参数似乎与使用 e1071 库的参数不同,我希望那里的人可能有一些见识。我一直在四处寻找,但没有找到示例中的“SVM()”和 e1071 中的“svm()”之间的区别。

0 投票
1 回答
553 浏览

r - 为什么递归特征消除过程不能消除无用的预测器?

我正在尝试选择变量y的最佳预测因子

x1x3是 y 的预测变量,x2x1相关,x4是虚拟变量。

在此处输入图像描述

  • 为什么递归特征消除程序告诉我保留所有预测变量,即使在查看x2x4无用的变量重要性时非常清楚?
0 投票
1 回答
689 浏览

python - GridsearchCV 和 RFECV 与 python

我正在训练一个模型,为此我需要一个属性选择器(使用 RFECV),然后我需要优化模型的参数(GridSearchCV)。

代码

执行前面的代码时出现错误:

如何解决?哪个可能到期?

更新 1

我放了:

但我得到了这个错误:

我究竟做错了什么?

更新 2

当我拆分数据时,有 2 个具有相同 id 的项目无法分开。

Order_train 创建:

订单列车:

0 投票
1 回答
478 浏览

r - caret-rfe:在 x 和 y 中应该有相同数量的样本

我正在尝试从 caret 包中实现 rfe。我对 X 和 Y 有相同数量的观察,但不断收到错误。

x 和 y 中应该有相同数量的样本

我的脚本如下

观察计数

以前有人见过这个问题吗?任何帮助是极大的赞赏。谢谢你。

0 投票
1 回答
251 浏览

r - 如何在插入符号包中为 RFE 中的最佳模型绘制 ROC 曲线

在 RFE 插入符号包中选择特征后,是否可以为最佳模型绘制 ROC 曲线?

我的代码如下:

结果:

如何绘制选择 3 个变量(AUC=0.6980)的模型的 ROC 曲线?

0 投票
1 回答
1446 浏览

python - RuntimeError:分类器未公开“coef_”或“feature_importances_”属性

在我的代码中,它会引发运行时错误。在这里,我试图为回归数据拟合 RFE。

0 投票
1 回答
1586 浏览

r - 从插入符号递归特征消除 (rfe) 结果中检索选定的变量

在我的工作项目中,我使用 caret 包中的 rfe 函数来进行递归特征消除。我用一个玩具例子来说明我的观点。

选择的最佳变量是基于那些在过程中给出最高 auroc 并且可以通过 检索的变量results$optVariables。但是,我想要做的是使用“1 个标准错误规则”来选择更少的功能(下面的代码)。识别的变量数为 4。

我确定的变量数是 4。现在我需要知道哪四个变量。我在下面做了:

它向我展示了 5 个变量!

有谁知道我如何检索这些变量?基本上,它适用于为选定的任意数量的变量获取这些变量。

提前非常感谢!

0 投票
1 回答
777 浏览

scikit-learn - 使用 RFECV 和 GridSearchCV 堆叠 StandardScaler()

所以我发现 StandardScaler() 可以让我的 RFECV 在我的 GridSearchCV 中,每个嵌套的 3 折交叉验证运行得更快。如果没有 StandardScaler(),我的代码运行了超过 2 天,所以我取消并决定将 StandardScaler 注入到进程中。但现在它已经运行了 4 个多小时,我不确定我是否做得对。这是我的代码:

老实说,我认为我的做法并不正确,因为我认为 StandardScaler() 应该放在 GridSearchCV() 函数中,以便每次折叠都标准化数据,而不仅仅是一次(?)。如果我错了或者我的管道不正确以及为什么它仍然运行了很长时间,请纠正我。

我有 8,000 行的 145 个特征要被 RFECV 修剪,以及 6 个 C 值要被 GridSearchCV 修剪。因此对于每个 C-Value,最佳特征集由 RFECV 确定。

谢谢!

更新:

所以我将 StandardScaler 放在 RFECV 中,如下所示:

但它仍然抛出以下错误:

ValueError: 估计器管道的参数 C 无效(memory=None, steps=[('standardscaler', StandardScaler(copy=True, with_mean=True, >with_std=True)), ('svc', SVC(C=1.0, cache_size =200,class_weight=None,>coef0=0.0,decision_function_shape='ovr',degree=3,gamma='auto',kernel='linear',max_iter=-1,probability=False,random_state=None,shrinking=True , tol=0.001, 详细=False))])。使用 > 检查可用参数列表estimator.get_params().keys()

0 投票
1 回答
691 浏览

python - RFECV 或任何其他特征选择之前的数据准备

我试图弄清楚在特征选择之前删除高度相关和负相关的特征是否明智。这是我的代码的快照

因此,我尝试了删除相关功能和不删除相关功能,并获得了完全不同的功能。RFECV 和其他特征选择(降维方法)是否考虑了这些高度相关的特征?我在这里做正确的事吗?最后,如果删除高阈值特征是一个好主意,我应该在这样做之前进行缩放。谢谢你。

凯文

0 投票
2 回答
106 浏览

python - 每次删除排名最低的特征时运行递归特征提取多次迭代的代码

好的,所以我想在我的数据集上运行具有 X 个特征的递归特征提取,并在每次迭代中删除排名最低的特征,而不是重新运行 RFE,直到我只剩下 5 个特征。但是,我不知道如何编码。

运行 RFE 的第一部分很好,但我不想坐下来手动重新运行 RFE 并一次删除一个功能,这将花费很长时间。有人可以帮我编码吗?