问题标签 [rfe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
649 浏览

r - R - Caret RFE 在使用 pickSizeBest 时给出“任务 1 失败 - 停止”错误

我正在使用 Caret R 包来训练 SVM 模型。我的代码如下:

当我注释掉 pickSizeBest 行时,算法运行良好。但是,当我不发表评论时,它会给出以下错误:

第 58 行是svmProf <- rfe( x = data_x,..

如果我以错误的方式使用pickSizeBest,我试图查找,但我找不到问题。有人可以帮我吗?

非常感谢!

编辑:我刚刚意识到不pickSizeBest (data, ...)应该使用data. 但是,我仍然不知道应该在那里添加什么。

0 投票
1 回答
700 浏览

r - rfe.defau 中的 R 错误:“x 和 y 中的样本数应该相同”

我无法让插入符号 rfe 工作。从已知的开始,http ://machinelearningmastery.com/feature-selection-with-the-caret-r-package/ 中的示例完美无缺。

但是,当我替换自己的数据集时,它失败了:

据我所知,x 和 y 中的样本行数是相同的;

详情见下文。

我看过类似的问题,例如R rfe function "caret" Package error: should have the same number of samples in x and y and R trying to get caret / rfe to work。后者是相关的,但似乎没有帮助。我试过将我的 y 转换为矢量

或者

但错误仍然存​​在。当然我做了一些愚蠢的事情,我只是看不到我错在哪里。任何帮助表示赞赏。

:-)

亚克

- - - - - - - - - - - 细节 - - - - - - -

- - - 脚本 - - - -

- - - 特征 - - -

0 投票
1 回答
2923 浏览

r - 在 R 中,插入符号包 RFE 函数选择的特征超出了允许的大小

我有一个简单的代码,用于rfe对我的数据的不同时间段执行特征选择。我使用以下rfeControlrfe函数调用:

每次运行时,我都会将值插入到列表中:

不知何故,尽管我将大小设置为最大 12,但在我的 20 个时间段中的 2 个中,特征选择会产生 65 个特征(这是初始数据集中的特征总数)。

我是使用此功能的新手,我不知道我在这里做错了什么,感谢任何帮助!

谢谢!

0 投票
1 回答
1008 浏览

r - R插入符号的rfe函数中的“承诺已经在评估中”错误

我有一个矩阵X和向量Y,我将其用作包中rfe函数的参数caret。它很简单:

我收到一个我无法破译的奇怪错误:

承诺已经在评估中:递归默认参数引用或早期问题?

编辑:这是我数据的前 5 行的可重现示例:

我的 R 版本是 3.2.3。插入符号包是 6.0-76。

有人知道这是什么吗?

0 投票
1 回答
632 浏览

r - 使用插入符号消除递归特征:度量“ROC”不是由汇总函数创建的

我很感激一些帮助,开始使用该caret包进行递归功能消除。我有 74 个值介于 0 和 1 之间的特征,以及一个取值为 0 或 1 的分类变量。

我想找到预测分类的最佳项目子集。我选择的指标是 ROC。

似乎 3 个功能的子集是最好的:

但我遇到两种类型的错误:

指标“ROC”不是由汇总函数创建的;将使用“RMSE”代替

响应具有五个或更少的唯一值。您确定要进行回归吗?

是否有不同的参数来允许我拥有的功能?功能 v1:v69 最初是 0-9 的比例,我重新调整为 0-1。功能 v70-v74 最初的比例为 0-3,我重新调整为 0-1。如警告所示,某些功能只有 2 或 3 个唯一值。

0 投票
1 回答
258 浏览

scikit-learn - 使用 CV 算法对递归特征消除的引用

有谁知道 RFECV 所依据的文章的引文?我查看了文档和此处,但没有发现任何相关信息。

看这里我发现了以下参考http://rdcu.be/xFbx但是这个参考和实现的代码之间没有明确的联系。

谢谢,

0 投票
0 回答
712 浏览

svm - { 中的错误:任务 1 失败 - 使用 ROC 的 rfe-svm 中的“参数长度为零”

我插入的所有打印件均已成功打印,但出现错误:{ 中的错误:任务 1 失败 - “参数长度为零”

请注意,如果我不添加插入,我会得到一个不同的错误(运行忽略虚线之间的内容):{中的错误:任务 1 失败 - “选择了未定义的列”

更新 我打印了堆栈跟踪并收到此错误,该错误与最后一行相关联rfe(iris[,-5], iris[,5], sizes = subsetsize...)

任何人都可以尝试解释发生了什么吗?

0 投票
2 回答
6789 浏览

python-2.7 - 从递归特征消除 (RFE) 中提取最优特征

我有一个由具有 124 个特征的分类和数值数据组成的数据集。为了降低它的维度,我想删除不相关的特征。但是,为了针对特征选择算法运行数据集,我使用 get_dummies 对其进行了热编码,从而将特征数量增加到 391。

根据Scikit Learn 示例,使用生成的数据,我可以通过交叉验证运行递归特征消除:

产生:

交叉验证分数与特征图

鉴于识别的最佳特征数为 8,我如何识别特征名称?我假设我可以将它们提取到一个新的 DataFrame 中以用于分类算法?


[编辑]

在这篇文章的帮助下,我实现了以下目标:

产生:

鉴于一种热编码引入了多重共线性,我认为目标列选择并不理想,因为它选择的特征是非编码的连续数据特征。我尝试重新添加未编码的目标列,但 RFE 抛出以下错误,因为数据是分类的:

我是否需要将多个热编码特征列组合为目标?


[编辑 2]

如果我只是对目标列进行 LabelEncode,我可以将此目标用作 'y'再次参见示例。但是,输出仅将单个特征(目标列)确定为最佳。我认为这可能是因为一个热编码,我是否应该考虑生产一个密集的阵列,如果是这样,它可以针对 RFE 运行吗?

谢谢,

亚当

0 投票
1 回答
1071 浏览

python - 从 gridsearchCV 中的 RFECV 检索选定的特征

我想编写一个代码,网格搜索几个处理器和预处理器,但也搜索不同的功能组合。我通过在 gridsearchCV 中使用 RFECV 来做到这一点。但是,这需要很长时间才能运行。因此,我颠倒了顺序。我进行了网格搜索,然后将其放入 RFECV 中。现在,我想查看并打印在最佳模型中实际选择了哪些功能。我尝试了这个网站上的几个解决方案,但没有一个奏效。如何访问选定的功能?两者都grid_dem.get_support(indices=True)没有grid_dem.support_工作。我得到这个和其他类似的错误:AttributeError: 'RFECV' object has no attribute 'support_'

我的代码的相关部分是:

正如您在最后两行中看到的,我也尝试转换 X,但这也不起作用。

0 投票
0 回答
131 浏览

python - RFE 中承认的数据类型以将特征保留在逻辑回归中

我正在尝试使用包含连续特征和一些二进制特征的数据集在 python 中构建逻辑回归。

为了选择我将包含在模型中的功能,我正在使用 RFE。所以基本上我有这个代码

其中 y 包含 1 和 0,而 X 具有 int 或 float 数据。

当我尝试用 RFE 拟合模型时,我不断得到这个:

ValueError:必须仅通过布尔值传递 DataFrame

所以我不确定这个函数是否只接受带有布尔值的数据帧,因为我已经看到了带有连续变量的例子。

在此先感谢您的帮助!