问题标签 [rfe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R - Caret RFE 在使用 pickSizeBest 时给出“任务 1 失败 - 停止”错误
我正在使用 Caret R 包来训练 SVM 模型。我的代码如下:
当我注释掉 pickSizeBest 行时,算法运行良好。但是,当我不发表评论时,它会给出以下错误:
第 58 行是svmProf <- rfe( x = data_x,..
如果我以错误的方式使用pickSizeBest,我试图查找,但我找不到问题。有人可以帮我吗?
非常感谢!
编辑:我刚刚意识到不pickSizeBest (data, ...)
应该使用data
. 但是,我仍然不知道应该在那里添加什么。
r - rfe.defau 中的 R 错误:“x 和 y 中的样本数应该相同”
我无法让插入符号 rfe 工作。从已知的开始,http ://machinelearningmastery.com/feature-selection-with-the-caret-r-package/ 中的示例完美无缺。
但是,当我替换自己的数据集时,它失败了:
据我所知,x 和 y 中的样本行数是相同的;
详情见下文。
我看过类似的问题,例如R rfe function "caret" Package error: should have the same number of samples in x and y and R trying to get caret / rfe to work。后者是相关的,但似乎没有帮助。我试过将我的 y 转换为矢量
或者
但错误仍然存在。当然我做了一些愚蠢的事情,我只是看不到我错在哪里。任何帮助表示赞赏。
:-)
亚克
- - - - - - - - - - - 细节 - - - - - - -
- - - 脚本 - - - -
- - - 特征 - - -
r - 在 R 中,插入符号包 RFE 函数选择的特征超出了允许的大小
我有一个简单的代码,用于rfe
对我的数据的不同时间段执行特征选择。我使用以下rfeControl
和rfe
函数调用:
每次运行时,我都会将值插入到列表中:
不知何故,尽管我将大小设置为最大 12,但在我的 20 个时间段中的 2 个中,特征选择会产生 65 个特征(这是初始数据集中的特征总数)。
我是使用此功能的新手,我不知道我在这里做错了什么,感谢任何帮助!
谢谢!
r - R插入符号的rfe函数中的“承诺已经在评估中”错误
我有一个矩阵X
和向量Y
,我将其用作包中rfe
函数的参数caret
。它很简单:
我收到一个我无法破译的奇怪错误:
承诺已经在评估中:递归默认参数引用或早期问题?
编辑:这是我数据的前 5 行的可重现示例:
我的 R 版本是 3.2.3。插入符号包是 6.0-76。
有人知道这是什么吗?
r - 使用插入符号消除递归特征:度量“ROC”不是由汇总函数创建的
我很感激一些帮助,开始使用该caret
包进行递归功能消除。我有 74 个值介于 0 和 1 之间的特征,以及一个取值为 0 或 1 的分类变量。
我想找到预测分类的最佳项目子集。我选择的指标是 ROC。
似乎 3 个功能的子集是最好的:
但我遇到两种类型的错误:
指标“ROC”不是由汇总函数创建的;将使用“RMSE”代替
和
响应具有五个或更少的唯一值。您确定要进行回归吗?
是否有不同的参数来允许我拥有的功能?功能 v1:v69 最初是 0-9 的比例,我重新调整为 0-1。功能 v70-v74 最初的比例为 0-3,我重新调整为 0-1。如警告所示,某些功能只有 2 或 3 个唯一值。
scikit-learn - 使用 CV 算法对递归特征消除的引用
有谁知道 RFECV 所依据的文章的引文?我查看了文档和此处,但没有发现任何相关信息。
看这里我发现了以下参考http://rdcu.be/xFbx但是这个参考和实现的代码之间没有明确的联系。
谢谢,
svm - { 中的错误:任务 1 失败 - 使用 ROC 的 rfe-svm 中的“参数长度为零”
我插入的所有打印件均已成功打印,但出现错误:{ 中的错误:任务 1 失败 - “参数长度为零”
请注意,如果我不添加插入,我会得到一个不同的错误(运行忽略虚线之间的内容):{中的错误:任务 1 失败 - “选择了未定义的列”
更新
我打印了堆栈跟踪并收到此错误,该错误与最后一行相关联rfe(iris[,-5], iris[,5], sizes = subsetsize...)
:
任何人都可以尝试解释发生了什么吗?
python-2.7 - 从递归特征消除 (RFE) 中提取最优特征
我有一个由具有 124 个特征的分类和数值数据组成的数据集。为了降低它的维度,我想删除不相关的特征。但是,为了针对特征选择算法运行数据集,我使用 get_dummies 对其进行了热编码,从而将特征数量增加到 391。
根据Scikit Learn 示例,使用生成的数据,我可以通过交叉验证运行递归特征消除:
产生:
鉴于识别的最佳特征数为 8,我如何识别特征名称?我假设我可以将它们提取到一个新的 DataFrame 中以用于分类算法?
[编辑]
在这篇文章的帮助下,我实现了以下目标:
产生:
鉴于一种热编码引入了多重共线性,我认为目标列选择并不理想,因为它选择的特征是非编码的连续数据特征。我尝试重新添加未编码的目标列,但 RFE 抛出以下错误,因为数据是分类的:
我是否需要将多个热编码特征列组合为目标?
[编辑 2]
如果我只是对目标列进行 LabelEncode,我可以将此目标用作 'y'再次参见示例。但是,输出仅将单个特征(目标列)确定为最佳。我认为这可能是因为一个热编码,我是否应该考虑生产一个密集的阵列,如果是这样,它可以针对 RFE 运行吗?
谢谢,
亚当
python - 从 gridsearchCV 中的 RFECV 检索选定的特征
我想编写一个代码,网格搜索几个处理器和预处理器,但也搜索不同的功能组合。我通过在 gridsearchCV 中使用 RFECV 来做到这一点。但是,这需要很长时间才能运行。因此,我颠倒了顺序。我进行了网格搜索,然后将其放入 RFECV 中。现在,我想查看并打印在最佳模型中实际选择了哪些功能。我尝试了这个网站上的几个解决方案,但没有一个奏效。如何访问选定的功能?两者都grid_dem.get_support(indices=True)
没有grid_dem.support_
工作。我得到这个和其他类似的错误:AttributeError: 'RFECV' object has no attribute 'support_'
我的代码的相关部分是:
正如您在最后两行中看到的,我也尝试转换 X,但这也不起作用。
python - RFE 中承认的数据类型以将特征保留在逻辑回归中
我正在尝试使用包含连续特征和一些二进制特征的数据集在 python 中构建逻辑回归。
为了选择我将包含在模型中的功能,我正在使用 RFE。所以基本上我有这个代码
其中 y 包含 1 和 0,而 X 具有 int 或 float 数据。
当我尝试用 RFE 拟合模型时,我不断得到这个:
ValueError:必须仅通过布尔值传递 DataFrame
所以我不确定这个函数是否只接受带有布尔值的数据帧,因为我已经看到了带有连续变量的例子。
在此先感谢您的帮助!