我试图从一个表达式中找到一个有用的特征选择方法,该方法对一组 20000 个基因进行,set(microarray)
以获得一个仅包含有用基因的模型。我尝试使用插入符号中的 RFE,但我得到了一个 stackOverflow,因为后向选择不支持 where 的数据n(predictors) > n(samples)
。任何人都可以提出一个合理的方法,或者这种 RFE 选择方法的解决方案吗?
提前致谢。
我试图从一个表达式中找到一个有用的特征选择方法,该方法对一组 20000 个基因进行,set(microarray)
以获得一个仅包含有用基因的模型。我尝试使用插入符号中的 RFE,但我得到了一个 stackOverflow,因为后向选择不支持 where 的数据n(predictors) > n(samples)
。任何人都可以提出一个合理的方法,或者这种 RFE 选择方法的解决方案吗?
提前致谢。
您是否尝试使用遗传算法进行特征选择?有不同的软件包可以做到这一点 - GA、genalg、caret(在 R 中)。
看看这个博客,已经用例子解释了使用遗传算法的特征选择 - http://topepo.github.io/caret/GA.html
希望能帮助到你。