我有一个存储如下的决策树(使用 data.tree)(在 R 中):
性别¦--
男
¦ °--等级 ¦ ¦--
第三级
¦ ¦ ° --年龄 ¦ ¦ ¦--
儿童
¦ ¦ ¦ ° --无 ¦ ¦ °--成人
¦ ¦ °--无 ¦ ¦-- 1st
¦ ¦ ° --年龄 ¦ ¦
¦--
成人 ¦ ¦ ¦ °--无 ¦ ¦ °--儿童 ¦ ¦ °--有
¦ ¦--2nd
¦ ¦ ° --年龄 ¦ ¦ ¦--
成人
¦ ¦ ¦ °--无 ¦ ¦ °--儿童
¦ ¦ °--有 ¦ °--船员
¦ °--年龄 ¦
°--成人
¦ °--无 °--女性
°--班级
¦--3rd
¦ ° --年龄 ¦
¦--
儿童¦ ¦ °--无 ¦ °--成人 ¦ °--无
¦--1st
¦ ° --年龄 ¦ ¦--
成人
¦ ¦ ° --有¦ °--儿童 ¦ °--是 ¦--
第二
¦ ° --年龄 ¦ ¦--
成人
¦ ¦ ° --是 ¦ °--儿童 ¦ °--是 °--船员 °--
年龄
°
- -成人
°--是的
这棵树存储在一个变量中:根
我想修剪树(计算所有节点的卡方值,级别 = 6,如果它们的卡方值小于阈值(示例 6),则删除该节点从树上)。
任何帮助将非常感激。
编辑:我正在使用以下数据集:
"","Class","Sex","Age","Survived"
"1","1st","Male","Child","No"
"2" ,"2nd","Male","Child","No"
"3","3rd","Male","Child","No"
.
.
.