问题标签 [rpart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 警告消息:使用 rpart 的插入符号 train() 中的“重采样性能测量中的缺失值”
我正在使用 caret 包来训练带有“rpart”包的模型;
数据没有缺失值或 NA,但是在运行命令时会出现警告消息;
有谁知道(或者可以指出我在哪里可以找到答案)这个警告是什么意思?我知道它告诉我在重新采样的性能指标中存在缺失值 - 但这究竟意味着什么?如何会出现这样的情况?顺便说一句,该predict()
功能适用于拟合模型,所以这只是我的好奇心。
r - 带有 rpart 的购物车不显示整个图
我正在尝试使用 rpart 绘制分类树,而 R 不包括我的所有变量。我有 20 个案例和 200 个变量。我的数据看起来像这样:
但是 x1 + x2 +x3 .... + x200。
我所有的变量值都与此类似;非常小,有些甚至平均约为 0.0005。我需要一个分类树,我的 y 是二进制的,所以我想要 method = "class" :
当我输入
我得到:
我不确定为什么它只根据 x50 拆分。我尝试绘制它以查看发生了什么,以及何时执行
我得到了以下情节:http: //i.imgur.com/cCTa69a.png
知道发生了什么,或者我该如何解决这个问题?非常感激。
r - 使用 rpart 构建具有分类变量的分类树
我有一个包含 14 个特征的数据集,其中很少有如下所示,其中性别和婚姻状况是分类变量。
现在我正在使用 R 中的 rpart 库来构建分类树,使用以下内容
这给了我一个不考虑性别和婚姻状况的决策树。
我正在考虑为此使用 as.factor :
但我不确定如何将这些信息传递给 rpart。由于 rpart() 中的数据参数采用“trainingData”数据帧。它将始终采用此数据框中的值。我对 R 并不陌生,希望有人能在这方面提供帮助。
r - 在 as.party 函数中,我如何澄清不同节点的索引?
使用 rpart 创建我的 CART 后,我继续使用 partykit 包中的 as.party 函数将其转换为派对对象。随后出现错误:
as.party(tree.hunterpb1)
我只能假设它指的是我从文献中理解的因子变量所做的分区,因为索引适用于因子。我的树看起来像这样:
树.hunterpb1 n = 354
回溯显示,第一个分区到派对类的转换是正确完成的,但是基于因子变量的第二个分区失败并产生了所述错误。
以前在处理类似数据时不会出现此错误。我只能假设 as.party 函数没有找到索引。任何有关如何解决此问题的建议将不胜感激。
r - 在 R 中出现错误“可变长度不同(为 'columns_features' 找到)”
我正在将 rpart 函数应用于名为 train 的具有所有整数值的数据框。功能太多,因此我创建了一个公式。
在这里,我收到错误消息
当我检查公式时,它有
对于 column_features 它有
出于检查目的,当我在此处手动输入列名时,它可以工作
双引号是否会产生错误?有什么办法可以解决这个问题?我有很多功能,所以我无法手动输入每个功能。
r - 如何手动将规则添加到 R 中的分类树
我已经使用 R 中的 rpart 和 tree 包安装了两个分类树。我想手动向其中一个适合的树添加规则,以最简单的为准。有没有办法做到这一点?
这是我想要实现的示例(取自文章A Brief Tour of the Trees and Forests ):
这是拟合树的外观:
现在,假设出于某种原因(即我的先验知识或基于另一组数据的另一个拟合树),我想将对 NM 的响应设置为 Koc<5。由于此信息不在用于拟合上述树的训练集中,我如何将其合并到其中?
r - R caret 包(rpart):构造分类树
我正在努力使用 caret 包执行分类树几天。问题是我的因素变量。我生成了树,但是当我尝试使用最佳模型对测试样本进行预测时,它失败了,因为 train 函数为我的因子变量创建了虚拟变量,然后 predict 函数在测试集中找不到这些新创建的虚拟变量. 我应该如何处理这个问题?
我的代码如下:
下面是用于训练/测试的 str() 函数的示例:
然后我的代码是这样的:
一个样本
在这儿
这是错误:
model.tree1 <- predict(tree1$finalModel,testing) eval 中的错误(expr,envir,enclos):找不到对象 'sect_isodev1'
我对另一件事感到好奇。我在 Max Kuhn 的“Predictive Modeling with R”中发现了以下语法:
哪里rpartTune$finalModel
是与我相同的分类树(或我的与他的相同)。现在,R 不接受 type="class"。只键入="prob"。我因此而烦恼。
预先感谢您的回复
r - 如何在 R 中将 GBM 树转换为 rpart 或 ctree?
您是否知道将使用 gbm 包(使用函数提取)获得的树转换pretty.gbm.tree
为有关决策树构建(rpart
或ctree
)的任何对象的任何方法?
r - 如何从决策树中获取每个节点的百分比
如何创建一个包含下图中每个节点的百分比的表?
结果如下图:
我想输出一个表格,其中物种作为第一列,第二列中每个节点的相关百分比。表的第二次迭代将排除第一个节点 (100%) 并通过保留包含更高百分比的行来删除重复项。
在浏览了“rpart”文档之后,我仍然无法弄清楚如何创建这个表。请让我知道你的想法。
感谢您的时间。
r - 如何显示正确的国家而不是“cegh”?
作为 R 的初学者,我使用提供的“car.test.frame”数据集创建了一个分类树,该数据集根据国家/地区预测里程。我输入的命令是:
这导致了以下树:
如您所见,在顶层,Country=cegh 提供了第一个拆分,而 Country=egh 提供了第二个拆分。如何更改这些以反映实际的国家名称?我如何真正理解图表?