问题标签 [rpart]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
60985 浏览

r - 如何从决策树计算错误率?

有谁知道如何用 R 计算决策树的错误率?我正在使用该rpart()功能。

0 投票
1 回答
2935 浏览

r - rpart 节点分配

是否可以提取拟合rpart树的节点分配?当我将模型应用于新数据时会怎样?

这个想法是我想使用节点作为集群数据的一种方式。在其他包(例如 SPSS)中,我可以保存预测的类、概率和节点号以供进一步分析。

鉴于 R 有多么强大,我想有一个简单的解决方案。

0 投票
1 回答
4563 浏览

r - R:预测因子中超过 52 个级别,为打印而截断

嗨,我是 R 编程语言的初学者。我使用 rpart 包为回归树编写了一个代码。在我的数据中,我的一些自变量有 100 多个级别。运行 rpart 函数后,我收到以下警告消息“预测因子中超过 52 个级别,为打印而截断”并且我的树以非常奇怪的方式显示。例如,我的树按位置拆分,大约有 70 个不同的级别,但是当标签显示在树中时,它会显示“ZZZZZZZZZZZZZZZZ......”我没有任何位置叫“ZZZZZZZZ”

请帮我。

提前致谢。

0 投票
3 回答
4876 浏览

r - Rpart包生成的测试规则

我想以编程方式测试从树生成的一条规则。在树中,根和叶(终端节点)之间的路径可以解释为规则。

在 R 中,我们可以使用rpart包并执行以下操作:(在这篇文章中,我将使用iris数据集,仅用于示例目的)

有了这两行,我得到了一个名为 的树model,它的类是rpart.objectrpart文档,第 21 页)。这个对象有很多信息,并且支持多种方法。特别是,该对象有一个frame变量(可以以标准方式访问:model$frame)(同上)和方法path.rpathrpart文档,第 7 页),它为您提供从根节点到感兴趣节点的路径(node参数在功能)

变量的包含树row.namesframe节点号。该var列给出了节点中的分裂变量、yval拟合值和yval2类概率等信息。

但只有列中标记为<leaf>终端var节点(叶子)。在这种情况下,节点是 2、6 和 7。

如上所述,您可以使用path.rpart提取规则的方法(此技术在 rattle包和文章Sharma Credit Score中使用,如下所示:

此外,该模型将预测值的值保留在

该值与数据集中的列相对yvalmodel$frame

对于节点号为 7(行号为 5)的叶子,预测值为

规则是

因此,该规则可以理解为

我知道我可以测试(在测试数据集中,我将再次使用 iris 数据集)这条规则有多少真阳性,对新数据集进行子集如下

然后计算混淆矩阵

(注:我使用了与测试相同的 iris 数据集)

我如何以编程方式评估规则?我可以从规则中提取条件如下

但是,我怎么能从这里继续呢?我无法使用该subset功能

提前致谢

注意: 为了更清晰,这个问题已经过大量编辑

0 投票
1 回答
826 浏览

perl - 提取使用 R rpart 构建的回归树模型

我已经使用rpartR 中的包构建了几个回归树模型,我需要将它们迁移到另一种语言,例如 Perl。

predict 函数在 R 中运行良好,但是有没有办法在每个节点上打印出加权公式之类的东西?

0 投票
1 回答
2214 浏览

r - 二叉决策树(CART)的分裂和根节点

如何在回归树中找到拆分和根节点,我从多个向量制作了一个回归树,现在我必须提取多个向量的 rpart 的根节点。文件包含多个向量的数值A, B, C, D, E, F, G, Hex。一个向量包含 4,3,6,7,2,4,5,... 等类似其他 B,C,D,E,F,G,H .so 想要提取F(这是一个根节点我的情况)作为此输入的输出,在创建一棵树之后。谢谢。抱歉无法放置任何图像:(

这是我到目前为止所做的

F(F>=5.5)......现在我必须从拟合(回归树)及其拆分中提取根节点,有人可以帮助我吗?

0 投票
1 回答
2802 浏览

r - rpart 是自动剪枝吗?

rpart是自动剪枝吗?

rpart生成的决策树比 Oracle Data Mining 生成的具有自动剪枝功能的决策树要多得多。

0 投票
1 回答
704 浏览

r - 为 rpart 制定数据

连接列表的列名称以准备公式rpart

只是想连接名称(log_data),log_data是一个包含 60 个不同向量的列表,所以我只希望它们的列名采用某种格式,以便我可以将它们放在 rpart 中的公式中......就像rpart(A ~ B + C + D + E ,log_data),所以在这里,我只想将 formula="A~B+C+D+E" 提取为一个完整的字符串,其中 A,B,C,D,E 是我们必须从 log_data 中提取的列名,或者是否有任何从列表中获取树的更好方法。
我努力了,

收到错误

在哪里

由于列名太长或者可能是 n=60,它在 rpart 进入无限循环

我可以附上任何列名colnames(log_data) <- c(?),我应该在“?”处放什么,这样在 n=60 时很容易绘制它。

0 投票
1 回答
1643 浏览

r - tune() function e1071 / libsvm -error with rpart

我正在尝试调整rpart。我已经将我的数据拆分为训练集和简历集。tune.rpart便利功能似乎没有办法指定 cv 集。所以我正在使用常规tune()功能。

我的数据集中有 595 个潜在变量,所以我不想使用公式来指定。执行此操作时出现以下错误

代码:

数据位于: https ://docs.google.com/folder/d/0B2_rKFnvrjMAM3FGbnFvZm5laUk/edit

0 投票
2 回答
1865 浏览

r - 为什么R中的predict()函数不给出预测?

我的训练数据集有 40000 行。在我使用 CART 模型拟合之后

fit<-rpart(y~x,method="class")

我试图使用

predict(fit,data.frame(new_x),family="response")

错误信息是:

此外,我检查了"predicted value“,它们实际上是使用 training 拟合值x。有人知道原因吗?