2

在 FSelector information.gain 函数的函数定义中,

信息.增益(公式,数据)

公式的目的到底是什么?我正在尝试使用该功能为分类任务进行特征选择。在我在网上看到的几个例子中,这个公式似乎定义了类标签和数据集中的特征之间的某种关系。但是,如果是这种情况,我不知道特征和标签之间的确切线性关系,因为我正在执行分类任务,那么公式是什么?

4

1 回答 1

3

你可以.用来告诉 R 你想分析一个类变量和数据框中所有其他变量之间的依赖关系。例如对于iris数据集:

> library(FSelector)
> information.gain(Species~., iris)
                attr_importance
Sepal.Length       0.4521286
Sepal.Width        0.2672750
Petal.Length       0.9402853
Petal.Width        0.9554360

如果您只想分析变量子集的交互,您可以使用显式名称:

> information.gain(Species~Sepal.Length+Sepal.Width, iris)
                attr_importance
Sepal.Length       0.4521286
Sepal.Width        0.2672750
于 2015-10-20T16:29:20.107 回答