0

我已经通过在 R 中使用 FSelector 包在 R 中完成了信息增益特征选择

install.packages("RWekajars")
install.packages("FSelector")
library(FSelector)

weights <- information.gain(Classname~., df)

Attributes                                          attr_importance
X.1                                              3.6349780
X                                                3.6349780
Value_1                                          3.7128973
Value_1                                          0.9652070
Item_1                                           2.0845525

现在,我需要根据attr_importance 从中选择最佳功能。如何根据阈值选择R中的最佳特征以及如何设置阈值?

4

1 回答 1

0

cutoff.kPackage FSelector中有一种方法可以解决您的问题:

  • cutoff.k 选择 k 个最佳属性
  • cutoff.k.percent 选择最好的 k * 100% 的属性
  • cutoff.biggest.diff 选择一个明显优于其他属性的子集。

例如:results <- cutoff.k.percent(weights, 0.9)将返回所有属性,直到达到 0.9。或:results <- cutoff.k(weights, 2)将返回信息增益最多的 2 个属性。这能解决你的问题吗?

于 2017-11-10T12:52:53.627 回答