“rpart”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

12330 浏览

r - rpart 中 CP 表给出的树大小

在 R 包 rpart 中，什么决定了决策树 CP 表中呈现的树的大小？在下面的示例中，CP 表默认仅显示具有 1、2 和 5 个节点的树（分别为 nsplit = 0、1 和 4）。

是否有rpart()用于确定要呈现的树木大小的内在规则？是否可以强制printcp()返回所有可能大小的树的交叉验证统计信息，即对于上面的示例，还包括具有 3 个和 4 个节点的树的行（nsplit = 2, 3）？

2015-01-09T14:03:40.267

0 投票

3 回答

585 浏览

r - 使用省略号将参数传递给函数，并为某些不存在的函数设置默认值

我有一个主函数，它将参数传递给另一个rpart用于生成模型的函数。我希望有可能rpart.control使用省略号从主函数中指定。如果没有定义cpor minbucket，那么我想对这两个参数使用我的默认值。

到目前为止，我还没有成功 - 请参阅下面的草稿。目前该功能抱怨没有cp找到。我理解为什么，但无法弄清楚如果用户没有提供自己的控件，如何应用默认值。

r function ellipsis rpart

2015-01-11T08:21:18.663

0 投票

0 回答

1361 浏览

r - 使用 rpart 对象进行预测时出错

我使用 caret 包训练了一个模型。使用该函数进行预测时会出错。

在我的模型中，最终选择中只有两个变量。在对新数据集（仅具有模型选择的特征）进行预测时，出现错误：“找不到对象'Cell'”

这是示例程序。请帮助我。

我知道它会给你结果；如果你有 newdata 与 train 具有相同的结构。但有一件事让我担心：在未来的预测中，为什么我要收集所有其他变量信息，尽管它不用于预测。

r rpart

2015-01-14T10:45:08.457

0 投票

3 回答

41401 浏览

r - 在 R 中使用 rpart 函数时在 ExtractVars 中获取无效的模型公式

数据集可以从http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/下载

收到以下错误：

使用以下代码：

请注意，我已将 CSV 文件中的分隔符更改为逗号。

也许它没有正确读取数据。原谅我，我是 R 新手，不是一个很好的程序员。

r rpart

2015-01-14T20:21:44.700

0 投票

1 回答

875 浏览

r - 如何遍历R中rpart对象的树结构？我需要获取与子树关联的所有节点，我该怎么做？

我正在使用 rpart 构建决策树分类器。我希望根据与子树对应的叶节点的某些参数使用我自己的修剪功能。为此，我认为我需要遍历树。我探索了 rpart 的文档，但想不出办法。请帮忙。

r classification rpart

user2492724

2015-01-15T18:04:30.350

0 投票

1 回答

1488 浏览

r - How to print out a rpart tree result in text in Rshiny

You can easily print out an rpart tree result in text in R console with the following command.

And it prints out:

n= 81

node), split, n, loss, yval, (yprob) * denotes terminal node

1) root 81 17 absent (0.79012346 0.20987654) 2) Start>=8.5 62 6 absent (0.90322581 0.09677419)
4) Start>=14.5 29 0 absent (1.00000000 0.00000000) * 5) Start< 14.5 33 6 absent (0.81818182 0.18181818)
10) Age< 55 12 0 absent (1.00000000 0.00000000) * 11) Age>=55 21 6 absent (0.71428571 0.28571429)
22) Age>=111 14 2 absent (0.85714286 0.14285714) * 23) Age< 111 7 3 present (0.42857143 0.57142857) * 3) Start< 8.5 19 8 present (0.42105263 0.57894737) *

However, this does not work in Rshiny textOutput.
See the following Rshiny Code:

ui.r

server.r

If I run the above shiny APP, it give the following error:

Error in cat(list(...), file, sep, fill, labels, append) :
argument 1 (type 'list') cannot be handled by 'cat'

r shiny rpart

2015-02-05T18:07:30.220

0 投票

1 回答

3581 浏览

r - 如何强制 rpart 准确地执行 1 拆分

遇到与此类似的问题，我试图强制 rpart 进行一次拆分。这是一个重现我的问题的玩具示例：

隔离一个点应该是可能的（minbucket = 1），即使是最边际的改进（隔离一个点总是会降低错误分类率）应该导致保持分裂（cp = 0）。

为什么结果不包括任何拆分？以及我如何必须更改代码以始终获得准确的拆分？如果两者都分类为相同的因子输出，是否可以不保留拆分？

r decision-tree rpart

2015-02-27T08:01:47.263

0 投票

1 回答

1346 浏览

r - 如何使用文本绘制因子变量 rpart 的水平而不是标签/索引？

在因子变量上绘制树拆分会产生一个图，其中节点用因子的索引而不是级别的文本标记。如何绘制一棵树，其中标签是因子变量的实际水平？

例如，这里是足球运动员的样本数据。这个想法是国家（通过目标变量）解释了玩家的收入。国家被用作因子变量。

这是结果：

在此处输入图像描述

r plot tree rpart

2015-03-13T22:48:10.297

0 投票

1 回答

2999 浏览

r - 为什么使用 caret::train(..., method = "rpart") 的结果与 rpart::rpart(...) 不同？

我正在参加 Coursera Practical Machine Learning 课程，课程作业需要使用此数据集构建预测模型。将数据拆分为training和testing数据集后，根据感兴趣的结果（此处标记为y，但实际上是classe数据集中的变量）：

我尝试了两种不同的方法：

对比

我会假设他们会给出相同或非常相似的结果，因为初始方法加载了“rpart”包（向我建议它使用这个包作为方法）。但是，时间（caret慢得多）和结果非常不同：

Method 1 (caret)：

Method 2 (rpart)：

如您所见，第二种方法是更好的分类器 - 第一种方法对于 D 类和 E 类非常差。

我意识到这可能不是问这个问题的最合适的地方，但我真的很感激能更深入地了解这个问题和相关问题。caret似乎是一个统一方法和调用语法的好包，但我现在犹豫要不要使用它。

r r-caret rpart

2015-03-20T13:09:10.243

0 投票

2 回答

25128 浏览

r - rpart 决策树中的 rel 错误和 x 错误有什么区别？

我有一个来自 UCI 机器学习数据库 https://archive.ics.uci.edu/ml/datasets/Diabetes+130-US+hospitals+for+years+1999-2008的纯分类数据框

我正在使用 rpart 根据关于患者是否在 30 天之前返回的新类别（新的失败类别）形成决策树。

我正在为我的决策树使用以下参数

打印结果产生：

我看到随着决策树的分支，相对误差正在下降，但是 xerror 上升了——我不明白，因为我认为错误会减少分支越多，树越复杂.

我认为 xerror 是最重要的，因为大多数修剪树的方法都会从根部切割树。

为什么修剪树时关注的 xerror 是什么？而当我们总结决策树分类器的误差是多少时，误差是0.99231还是1.0031？

r machine-learning decision-tree rpart

2015-03-22T16:58:59.273

问题标签 [rpart]

Reference