问题标签 [rpart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rpart 中 CP 表给出的树大小
在 R 包 rpart 中,什么决定了决策树 CP 表中呈现的树的大小?在下面的示例中,CP 表默认仅显示具有 1、2 和 5 个节点的树(分别为 nsplit = 0、1 和 4)。
是否有rpart()
用于确定要呈现的树木大小的内在规则?是否可以强制printcp()
返回所有可能大小的树的交叉验证统计信息,即对于上面的示例,还包括具有 3 个和 4 个节点的树的行(nsplit = 2, 3)?
r - 使用省略号将参数传递给函数,并为某些不存在的函数设置默认值
我有一个主函数,它将参数传递给另一个rpart
用于生成模型的函数。我希望有可能rpart.control
使用省略号从主函数中指定。如果没有定义cp
or minbucket
,那么我想对这两个参数使用我的默认值。
到目前为止,我还没有成功 - 请参阅下面的草稿。目前该功能抱怨没有cp
找到。我理解为什么,但无法弄清楚如果用户没有提供自己的控件,如何应用默认值。
r - 使用 rpart 对象进行预测时出错
我使用 caret 包训练了一个模型。使用该函数进行预测时会出错。
在我的模型中,最终选择中只有两个变量。在对新数据集(仅具有模型选择的特征)进行预测时,出现错误:“找不到对象'Cell'”
这是示例程序。请帮助我。
我知道它会给你结果;如果你有 newdata 与 train 具有相同的结构。但有一件事让我担心:在未来的预测中,为什么我要收集所有其他变量信息,尽管它不用于预测。
r - 在 R 中使用 rpart 函数时在 ExtractVars 中获取无效的模型公式
数据集可以从http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/下载
收到以下错误:
使用以下代码:
请注意,我已将 CSV 文件中的分隔符更改为逗号。
也许它没有正确读取数据。原谅我,我是 R 新手,不是一个很好的程序员。
r - 如何遍历R中rpart对象的树结构?我需要获取与子树关联的所有节点,我该怎么做?
我正在使用 rpart 构建决策树分类器。我希望根据与子树对应的叶节点的某些参数使用我自己的修剪功能。为此,我认为我需要遍历树。我探索了 rpart 的文档,但想不出办法。请帮忙。
r - How to print out a rpart tree result in text in Rshiny
You can easily print out an rpart tree result in text in R console with the following command.
And it prints out:
n= 81
node), split, n, loss, yval, (yprob) * denotes terminal node
1) root 81 17 absent (0.79012346 0.20987654) 2) Start>=8.5 62 6 absent (0.90322581 0.09677419)
4) Start>=14.5 29 0 absent (1.00000000 0.00000000) * 5) Start< 14.5 33 6 absent (0.81818182 0.18181818)
10) Age< 55 12 0 absent (1.00000000 0.00000000) * 11) Age>=55 21 6 absent (0.71428571 0.28571429)
22) Age>=111 14 2 absent (0.85714286 0.14285714) * 23) Age< 111 7 3 present (0.42857143 0.57142857) * 3) Start< 8.5 19 8 present (0.42105263 0.57894737) *
However, this does not work in Rshiny textOutput.
See the following Rshiny Code:
ui.r
server.r
If I run the above shiny APP, it give the following error:
Error in cat(list(...), file, sep, fill, labels, append) :
argument 1 (type 'list') cannot be handled by 'cat'
r - 如何强制 rpart 准确地执行 1 拆分
遇到与此类似的问题,我试图强制 rpart 进行一次拆分。这是一个重现我的问题的玩具示例:
隔离一个点应该是可能的(minbucket = 1),即使是最边际的改进(隔离一个点总是会降低错误分类率)应该导致保持分裂(cp = 0)。
为什么结果不包括任何拆分?以及我如何必须更改代码以始终获得准确的拆分?如果两者都分类为相同的因子输出,是否可以不保留拆分?
r - 如何使用文本绘制因子变量 rpart 的水平而不是标签/索引?
在因子变量上绘制树拆分会产生一个图,其中节点用因子的索引而不是级别的文本标记。如何绘制一棵树,其中标签是因子变量的实际水平?
例如,这里是足球运动员的样本数据。这个想法是国家(通过目标变量)解释了玩家的收入。国家被用作因子变量。
这是结果:
r - 为什么使用 caret::train(..., method = "rpart") 的结果与 rpart::rpart(...) 不同?
我正在参加 Coursera Practical Machine Learning 课程,课程作业需要使用此数据集构建预测模型。将数据拆分为training
和testing
数据集后,根据感兴趣的结果(此处标记为y
,但实际上是classe
数据集中的变量):
我尝试了两种不同的方法:
对比
我会假设他们会给出相同或非常相似的结果,因为初始方法加载了“rpart”包(向我建议它使用这个包作为方法)。但是,时间(caret
慢得多)和结果非常不同:
Method 1 (caret)
:
Method 2 (rpart)
:
如您所见,第二种方法是更好的分类器 - 第一种方法对于 D 类和 E 类非常差。
我意识到这可能不是问这个问题的最合适的地方,但我真的很感激能更深入地了解这个问题和相关问题。caret
似乎是一个统一方法和调用语法的好包,但我现在犹豫要不要使用它。
r - rpart 决策树中的 rel 错误和 x 错误有什么区别?
我有一个来自 UCI 机器学习数据库 https://archive.ics.uci.edu/ml/datasets/Diabetes+130-US+hospitals+for+years+1999-2008的纯分类数据框
我正在使用 rpart 根据关于患者是否在 30 天之前返回的新类别(新的失败类别)形成决策树。
我正在为我的决策树使用以下参数
打印结果产生:
我看到随着决策树的分支,相对误差正在下降,但是 xerror 上升了——我不明白,因为我认为错误会减少分支越多,树越复杂.
我认为 xerror 是最重要的,因为大多数修剪树的方法都会从根部切割树。
为什么修剪树时关注的 xerror 是什么?而当我们总结决策树分类器的误差是多少时,误差是0.99231还是1.0031?