问题标签 [rpart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何从决策树计算错误率?
有谁知道如何用 R 计算决策树的错误率?我正在使用该rpart()
功能。
r - rpart 节点分配
是否可以提取拟合rpart
树的节点分配?当我将模型应用于新数据时会怎样?
这个想法是我想使用节点作为集群数据的一种方式。在其他包(例如 SPSS)中,我可以保存预测的类、概率和节点号以供进一步分析。
鉴于 R 有多么强大,我想有一个简单的解决方案。
r - R:预测因子中超过 52 个级别,为打印而截断
嗨,我是 R 编程语言的初学者。我使用 rpart 包为回归树编写了一个代码。在我的数据中,我的一些自变量有 100 多个级别。运行 rpart 函数后,我收到以下警告消息“预测因子中超过 52 个级别,为打印而截断”并且我的树以非常奇怪的方式显示。例如,我的树按位置拆分,大约有 70 个不同的级别,但是当标签显示在树中时,它会显示“ZZZZZZZZZZZZZZZZ......”我没有任何位置叫“ZZZZZZZZ”
请帮我。
提前致谢。
r - Rpart包生成的测试规则
我想以编程方式测试从树生成的一条规则。在树中,根和叶(终端节点)之间的路径可以解释为规则。
在 R 中,我们可以使用rpart
包并执行以下操作:(在这篇文章中,我将使用iris
数据集,仅用于示例目的)
有了这两行,我得到了一个名为 的树model
,它的类是rpart.object
(rpart
文档,第 21 页)。这个对象有很多信息,并且支持多种方法。特别是,该对象有一个frame
变量(可以以标准方式访问:model$frame
)(同上)和方法path.rpath
(rpart
文档,第 7 页),它为您提供从根节点到感兴趣节点的路径(node
参数在功能)
变量的包含树row.names
的frame
节点号。该var
列给出了节点中的分裂变量、yval
拟合值和yval2
类概率等信息。
但只有列中标记为<leaf>
终端var
节点(叶子)。在这种情况下,节点是 2、6 和 7。
如上所述,您可以使用path.rpart
提取规则的方法(此技术在 rattle
包和文章Sharma Credit Score中使用,如下所示:
此外,该模型将预测值的值保留在
该值与数据集中的列相对yval
应model$frame
。
对于节点号为 7(行号为 5)的叶子,预测值为
规则是
因此,该规则可以理解为
我知道我可以测试(在测试数据集中,我将再次使用 iris 数据集)这条规则有多少真阳性,对新数据集进行子集如下
然后计算混淆矩阵
(注:我使用了与测试相同的 iris 数据集)
我如何以编程方式评估规则?我可以从规则中提取条件如下
但是,我怎么能从这里继续呢?我无法使用该subset
功能
提前致谢
注意: 为了更清晰,这个问题已经过大量编辑
perl - 提取使用 R rpart 构建的回归树模型
我已经使用rpart
R 中的包构建了几个回归树模型,我需要将它们迁移到另一种语言,例如 Perl。
predict 函数在 R 中运行良好,但是有没有办法在每个节点上打印出加权公式之类的东西?
r - 二叉决策树(CART)的分裂和根节点
如何在回归树中找到拆分和根节点,我从多个向量制作了一个回归树,现在我必须提取多个向量的 rpart 的根节点。文件包含多个向量的数值A
, B
, C
, D
, E
, F
, G
, H
ex。一个向量包含 4,3,6,7,2,4,5,... 等类似其他 B,C,D,E,F,G,H .so 想要提取F
(这是一个根节点我的情况)作为此输入的输出,在创建一棵树之后。谢谢。抱歉无法放置任何图像:(
这是我到目前为止所做的
F(F>=5.5)
......现在我必须从拟合(回归树)及其拆分中提取根节点,有人可以帮助我吗?
r - rpart 是自动剪枝吗?
rpart是自动剪枝吗?
rpart生成的决策树比 Oracle Data Mining 生成的具有自动剪枝功能的决策树要多得多。
r - 为 rpart 制定数据
连接列表的列名称以准备公式rpart
?
只是想连接名称(log_data),log_data
是一个包含 60 个不同向量的列表,所以我只希望它们的列名采用某种格式,以便我可以将它们放在 rpart 中的公式中......就像rpart(A ~ B + C + D + E ,log_data)
,所以在这里,我只想将 formula="A~B+C+D+E" 提取为一个完整的字符串,其中 A,B,C,D,E 是我们必须从 log_data 中提取的列名,或者是否有任何从列表中获取树的更好方法。
我努力了,
收到错误
在哪里
由于列名太长或者可能是 n=60,它在 rpart 进入无限循环
我可以附上任何列名colnames(log_data) <- c(?),我应该在“?”处放什么,这样在 n=60 时很容易绘制它。
r - tune() function e1071 / libsvm -error with rpart
我正在尝试调整rpart
。我已经将我的数据拆分为训练集和简历集。tune.rpart
便利功能似乎没有办法指定 cv 集。所以我正在使用常规tune()
功能。
我的数据集中有 595 个潜在变量,所以我不想使用公式来指定。执行此操作时出现以下错误
代码:
数据位于: https ://docs.google.com/folder/d/0B2_rKFnvrjMAM3FGbnFvZm5laUk/edit
r - 为什么R中的predict()函数不给出预测?
我的训练数据集有 40000 行。在我使用 CART 模型拟合之后
fit<-rpart(y~x,method="class")
我试图使用
predict(fit,data.frame(new_x),family="response")
错误信息是:
此外,我检查了"predicted value
“,它们实际上是使用 training 拟合值x
。有人知道原因吗?