“rfe”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

392 浏览

r-caret - 特征选择

我试图从一个表达式中找到一个有用的特征选择方法，该方法对一组 20000 个基因进行，set(microarray)以获得一个仅包含有用基因的模型。我尝试使用插入符号中的 RFE，但我得到了一个 stackOverflow，因为后向选择不支持 where 的数据n(predictors) > n(samples)。任何人都可以提出一个合理的方法，或者这种 RFE 选择方法的解决方案吗？

提前致谢。

2015-11-09T14:58:43.010

0 投票

1 回答

537 浏览

r - 插入符号：使用 RFE 时出现“某些 row.names 重复”警告

我正在根据本文第 5 页的线性问题构建一个玩具数据集，以便使用带有 rbf 内核的 caret 的 RFE+SVM 测试特征选择。但是，当 RFE 完成时，每次引导迭代都会收到一条警告，其中包含以下消息：“In data.row.names(row.names, rowsi, i) : some row.names duplicated:” 后跟许多行号，直到输出被截断。

这是因为引导程序可能会选择替换样本并因此在引导数据中复制行，还是有其他问题？任何建议表示赞赏（请原谅人工数据集的延迟实现）。

r svm r-caret statistics-bootstrap rfe

2015-11-10T11:21:59.503

0 投票

2 回答

6891 浏览

python - 如何使用 sklearn 从 RFE 获取系数？

我正在使用递归特征估计 (RFE) 进行特征选择。这是通过迭代地采用估计器（例如 SVM 分类器），将其拟合到数据中，并删除具有最低权重（系数）的特征来实现的。

我能够将其与数据相匹配并执行特征选择。但是，我想从 RFE 中恢复每个特征的学习权重。

我使用下面的代码来初始化一个分类器对象和一个 RFE 对象，并将它们拟合到数据中。

然后我尝试打印系数

并收到：

根据sklearn 文档，分类器对象应具有以下属性：

我使用的是线性内核，所以这不是问题。

谁能解释为什么我无法恢复系数？有没有办法解决这个问题？

python machine-learning scikit-learn feature-selection rfe

2015-12-10T14:49:44.787

0 投票

0 回答

157 浏览

r - 在运行 NaiveBayes 之前执行 rfe 函数时出错

当我在执行 NaiveBayes 之前执行 rfe 进行特征选择时，

我收到以下错误

如您所见，我确实消除了所有 NULL 方差变量，然后还有什么其他原因可能导致该错误。非常感谢任何帮助。

仅供参考：tc_data_final 有 179 个变量和 164,000 个观察值。

在我执行 NaiveBayes 之前，任何其他功能选择选项的其他指针也会非常有帮助。

r r-caret naivebayes rfe

2015-12-16T13:49:27.787

0 投票

1 回答

932 浏览

r - R caret 的 rfe 使用 lrFuncs 导致 [Error in { :task 1 failed - “rfe is expecting 58 important values but only have 48”]

当我尝试使用rfe. lrFuncs我尝试了他们的建议，但他们没有解决我的问题。我们以 caret 包中的 GermanCredit 数据集为例。在这个数据集中，所有的因子（除了目标变量Class）都已经转换为二进制数值变量，所以我们不用担心使用model.matrix.

好的，那么我查看没有方差的变量（目标变量 Class 除外）并删除没有方差的变量（即只有一个唯一值）。

现在我查看相关变量并摆脱“重复”。

如果我现在尝试 rfe，我仍然会得到同样的错误。

对于解决此问题并了解此错误发生原因的任何帮助，我将不胜感激。

r r-caret rfe

2015-12-21T19:22:47.247

0 投票

1 回答

1890 浏览

r - Caret RFE to deal to dummy variables that are levels of the same categorical variable

I have a classification problem and one of the predictors is a categorical variable X with four levels A,B,C,D that was transformed to three dummy variables A,B,C. I was trying to use the Recursive Feature Selection (RFE) in the caret package to conduct feature selection. How do I tell the RFE function to consider A,B,C,D together? so if say A is excluded, B&C are excluded too.

After fighting with this all day, I'm still going nowhere...Feeding RFE using the formula interface also doesn't work. I think RFE automatically converts any factors to dummy variables.

Below is my example code:

x_frame here, contains categorical variables that have multiple levels.

Any help is highly appreciated!

r r-caret feature-selection dummy-variable rfe

2016-05-19T16:22:04.590

0 投票

0 回答

871 浏览

python - IndexError：索引 58 超出大小 58 的范围

我正在使用 RFECV 训练一些数据，以通过适当数量的功能获得最佳精度。但我一直收到与标题中提到的相同的错误。下面是代码。

错误发生在中probas_ = rfecv.fit(X[train], y[train]).predict_proba(X[test])，我真的不知道错误是什么。整个回溯如下：

我对此进行了调试，发现它令人困惑。

python matplotlib indexing roc rfe

2016-05-22T15:43:47.613

0 投票

1 回答

163 浏览

r - 在 RFE 过程（插入符号）中更改 ROC 计算 (pROC) 的默认参数 - R

我正在计算一个使用函数（包）"ROC"作为度量的 SVM-RFE 模型。据我所知，该算法使用包的函数及其预定义的参数来优化 AUC 值。但是，我想将参数设置为，而不是因为在某些情况下，结果平均 AUC 是反向计算的（我的数据不是很好......）。此处的答案中解释了此问题：使用 ROCR 和 pROC (R) 计算平均 AUC 的差异rfecaretrferocpROCdirection"<""auto"

如何roc在rfe计算中更改函数的默认参数值？

我试过这个简单的选项，但它不起作用：

r r-caret roc rfe proc-r-package

2016-05-24T10:25:53.213

0 投票

0 回答

57 浏览

r - 根据参数名称提取 R/Subset 函数中函数的参数代码

我正在使用caret包。它里面有很多功能methods。例子，

要检查rfe.default我们使用args()函数的参数，formalArgs()或者formals()

现在，我只想查看rfe.default函数内部使用的每个参数的代码，而不是我们通过键入获得的整个函数代码

如何获取这些参数的代码。

我们可以使用deparse()函数从函数代码中获取行的范围。但是有没有办法根据参数名称从函数中获取参数代码。

如果一个参数在其中使用一个函数，就像这里rfeContol = rfeControl()

我应该能够从rfe.default函数中提取这个参数的代码而不是整个代码或rfe.default.

谢谢。

r function r-caret args rfe

2016-09-12T07:15:38.413

0 投票

0 回答

689 浏览

python - Scikit RFECV 不适用于浮动步骤

我正在使用 scikit 的递归特征消除来摆脱一些特征。

使用直接RFE时，我可以将步骤设置为浮点数，这意味着（例如）每一步都应该消除 10% 的特征。它运作良好。

切换到RFECV时，这似乎不起作用。

代码示例（适用于RFE并与RFECV失败）：

症状：

过程永无止境地进行下去。
似乎没有内核激活。
标准输出打印：... lib/python3.4/site-packages/sklearn/feature_selection/rfe.py:198: DeprecationWarning: using a non-integer number instead of an integer will result in an error in the future support_[features[ranks][:threshold]] = False
标准输出也打印：（
Fitting estimator with 177 features. Fitting estimator with 177 features. Fitting estimator with 177 features. Fitting estimator with 124 features. Fitting estimator with 124 features. Fitting estimator with 71 features. Fitting estimator with 71 features. Fitting estimator with 124 features. Fitting estimator with 18 features. Fitting estimator with 18 features. Fitting estimator with 71 features. Fitting estimator with 18 features.
但实际上什么也没发生）
适用于整数步长

python scikit-learn cross-validation feature-selection rfe

2016-09-29T14:18:23.447

问题标签 [rfe]

Reference