r - 在使用 rpart 包时控制预测变量的拆分次数

翻译自：https://stackoverflow.com/questions/25814503 2014-09-12T18:23:55.300

419 次

一般来说，我是第一次使用决策树模型，但不确定运行决策树得到的输出是否符合预期。数据集中有 700 多个预测变量可用。

我使用了 rpart 包并发布了以下声明：

data_rpart <- rpart(GOOD~.,data=data_Train)

输出仅显示 2 个关键预测变量（24 个月内的交易和 12 个月内的访问），如下所示：规则编号：4 [GOOD=0.0735211267605634 cover=10650 (72%)] trans_24mth< 4.5 trans_24mth< 2.5

Rule number: 5 [GOOD=0.214780600461894 cover=2165 (15%)]
     trans_24mth< 4.5
     trans_24mth>=2.5

Rule number: 7 [GOOD=0.511111111111111 cover=990 (7%)]
     trans_24mth>=4.5
     visit_12mth>=10.5

Rule number: 6 [GOOD=0.307862679955703 cover=903 (6%)]
     trans_24mth>=4.5
     visit_12mth< 10.5

从早期在 SAS 中拟合的逻辑回归模型中，我知道这些变量与模型相关。

我的问题是我们是否可以控制模型中显示的变量数量？现在从 700 个变量中似乎只有 2 个变量出现。我们有没有办法强制 rpart 语句在规则中显示更多变量？这一个仅显示交易变量作为预测变量；但是说我想看看数据集中的人口统计/心理变量是否也在识别模型中的好/坏方面发挥任何作用？在此先感谢您的帮助

r - 在使用 rpart 包时控制预测变量的拆分次数

0 回答 0

Related

Reference