0

一般来说,我是第一次使用决策树模型,但不确定运行决策树得到的输出是否符合预期。数据集中有 700 多个预测变量可用。

我使用了 rpart 包并发布了以下声明:

data_rpart <- rpart(GOOD~.,data=data_Train)

输出仅显示 2 个关键预测变量(24 个月内的交易和 12 个月内的访问),如下所示: 规则编号:4 [GOOD=0.0735211267605634 cover=10650 (72%)] trans_24mth< 4.5 trans_24mth< 2.5

Rule number: 5 [GOOD=0.214780600461894 cover=2165 (15%)]
     trans_24mth< 4.5
     trans_24mth>=2.5

Rule number: 7 [GOOD=0.511111111111111 cover=990 (7%)]
     trans_24mth>=4.5
     visit_12mth>=10.5

Rule number: 6 [GOOD=0.307862679955703 cover=903 (6%)]
     trans_24mth>=4.5
     visit_12mth< 10.5

从早期在 SAS 中拟合的逻辑回归模型中,我知道这些变量与模型相关。

我的问题是我们是否可以控制模型中显示的变量数量?现在从 700 个变量中似乎只有 2 个变量出现。我们有没有办法强制 rpart 语句在规则中显示更多变量?这一个仅显示交易变量作为预测变量;但是说我想看看数据集中的人口统计/心理变量是否也在识别模型中的好/坏方面发挥任何作用?在此先感谢您的帮助

4

0 回答 0