1

我正在做一个小项目。可以说,我有一个包含大约 10 万条记录的表,其中包含年龄、性别、地区、生活(标称 - 产品使用天数)等列,这里生活是一个因变量,所有其他都是自变量。我创建了可用数据中的决策树。现在我的查询是,假设如果我有一条新记录,我想知道该记录在遍历决策树后落在哪个终端节点,即该记录落在哪个生命范围内。为此,我如何将该记录传递给决策树并获得输出?

4

1 回答 1

0

predict(model,newdata)

假设data.frame您在问题中列出的原件有 4 列。您的新记录需要格式化为 data.frame,其列名称与您的独立因素相同,例如,newdata = data.frame(Age=15,Gender="Male",Region="Southwest")或任何这些值。假设您已经存储了模型,model = rpart(Life~.,data=data,method="class")然后predict(model,newdata)将返回新记录属于每个终端类的概率向量。然后,您需要有一些截止逻辑来确定您将其分配到哪个组。

于 2015-02-20T15:33:55.233 回答