在使用 CART 时,我想使用 Gini 指数从整个属性中选择主要属性。
但我找不到任何包含它的函数或包。
如果有任何计算基尼指数的函数或包,请告诉我。
如果您使用rpart
from 的函数拟合 CART 模型,library(rpart)
则可以选择将分割标准指定为基尼系数或信息统计量。
语法是:
rpart(y~x+z, data=df, parms=list(split='gini'))
事实上,'gini' 是默认值,所以如果你只使用这个rpart
函数,它无论如何都会使用 gini 系数。更多你可以在这里查看方法和包的pdf介绍。
如果我误解了您使用它的目的,并且您只想要计算基尼系数的函数,您可以查看包ineq
,包括ineq()
将为您计算各种不等式分数的函数。文档在这里。