我正在使用 Scikit-learn Extremely Randomized Trees 算法来获取有关相对特征重要性的信息,并且我对如何对“冗余特征”进行排名有疑问。
如果我有两个相同(冗余)且对分类很重要的特征,则极度随机化的树无法检测到特征的冗余。也就是说,这两个功能都获得了很高的排名。有没有其他方法可以检测到两个特征实际上是多余的?
我正在使用 Scikit-learn Extremely Randomized Trees 算法来获取有关相对特征重要性的信息,并且我对如何对“冗余特征”进行排名有疑问。
如果我有两个相同(冗余)且对分类很重要的特征,则极度随机化的树无法检测到特征的冗余。也就是说,这两个功能都获得了很高的排名。有没有其他方法可以检测到两个特征实际上是多余的?