问题标签 [cart-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
26167 浏览

r - rpart“as.character(x) 中的错误:无法将'builtin' 类型强制转换为'character' 类型的向量”消息是什么意思?

rpart几天来我一直在努力(试图为我拥有的这个数据集制作分类树),我认为现在是时候询问生命线了 :-) 我确信这很愚蠢我没有看到,但这是我一直在做的事情:

对于我的一生,我无法弄清楚错误是关于什么的。

0 投票
1 回答
1101 浏览

r - “anova”(对于 lm)是否与 rpart 对象等价?

使用 R 的rpart函数时,我可以很容易地用它拟合模型。例如:

我的问题是 - 如何衡量我的三个解释变量(年龄、数字、开始)中的每一个对模型的“重要性”?

如果这是一个回归模型,我可以从“anova”F 检验中查看 p 值(在lm有和没有变量的模型之间)。但是在物体上使用“anova”的等价物是lm什么rpart

(我希望我能把我的问题说清楚)

谢谢。

0 投票
1 回答
7885 浏览

r - 在 R 中构建分类树时,如何解释因子变量上的 rpart 拆分?

如果因子变量是气候,有 4 个可能的值:热带、干旱、温带、雪,并且我的rpart树中的一个节点被标记为“气候:ab”,那么拆分是多少?

0 投票
3 回答
4154 浏览

r - 使用 rpart 在回归树中搜索相应的节点

我对 R 很陌生,我遇到了一个非常愚蠢的问题。

我正在使用rpart包校准回归树,以便进行一些分类和一些预测。

多亏了 R,校准部分易于操作且易于控制。

在校准了一个大决策树之后,我希望为给定的数据样本找到一些新数据的相应集群(以及预测值)。
predict功能似乎非常适合需要。

但是,使用该predict方法,我只能获得新元素的预测比率,并且找不到获取新元素所属的决策树叶的方法。

我认为它应该很容易得到,因为 predict 方法必须找到那个叶子才能返回比率。

有几个参数可以通过class=参数传递给 predict 方法,但是对于回归树来说似乎都返回相同的东西(决策树的目标属性的值)

有谁知道如何获取决策树中的相应节点?

通过使用该path.rpart方法分析节点,这将有助于我理解结果。

0 投票
1 回答
981 浏览

r - 可以处理 NA 的 R 包/模型

我正在寻找可以处理 NA 的 R 包或机器学习模型/算法(如randomForestglmnetgbdt等),而不是忽略具有任何 NA 实例的行或列。我不想推卸责任。有什么建议么?

0 投票
2 回答
1903 浏览

r - 具有强制结构的决策树

我一直在使用 rpart 包在 R 中使用决策树(CART)来查看 SST(预测变量)和气候(预测变量)之间的关系。

我想将树“强制”成一个特定的结构——即在预测变量 1 上拆分,然后在变量 2 上拆分。

我使用 R 已经有一段时间了,所以我我可以查看 rpart 函数背后的代码并对其进行修改以首先在特定的预测变量中搜索“最佳分割”。然而,rpart 函数调用 C 例程并且没有任何 CI 经验在这里迷失了......

我可以从头开始编写一个函数,但如果可能的话想避免它!所以我的问题是:

  • 是否有另一种决策树技术(最好在 R 中实现)可以强制树的结构?
  • 如果没有 - 有什么方法可以将 C 代码转换为 R 吗?
  • 还有其他想法吗?

在此先感谢,非常感谢您的帮助。

0 投票
1 回答
4563 浏览

r - R:预测因子中超过 52 个级别,为打印而截断

嗨,我是 R 编程语言的初学者。我使用 rpart 包为回归树编写了一个代码。在我的数据中,我的一些自变量有 100 多个级别。运行 rpart 函数后,我收到以下警告消息“预测因子中超过 52 个级别,为打印而截断”并且我的树以非常奇怪的方式显示。例如,我的树按位置拆分,大约有 70 个不同的级别,但是当标签显示在树中时,它会显示“ZZZZZZZZZZZZZZZZ......”我没有任何位置叫“ZZZZZZZZ”

请帮我。

提前致谢。

0 投票
1 回答
2214 浏览

r - 二叉决策树(CART)的分裂和根节点

如何在回归树中找到拆分和根节点,我从多个向量制作了一个回归树,现在我必须提取多个向量的 rpart 的根节点。文件包含多个向量的数值A, B, C, D, E, F, G, Hex。一个向量包含 4,3,6,7,2,4,5,... 等类似其他 B,C,D,E,F,G,H .so 想要提取F(这是一个根节点我的情况)作为此输入的输出,在创建一棵树之后。谢谢。抱歉无法放置任何图像:(

这是我到目前为止所做的

F(F>=5.5)......现在我必须从拟合(回归树)及其拆分中提取根节点,有人可以帮助我吗?

0 投票
1 回答
704 浏览

r - 为 rpart 制定数据

连接列表的列名称以准备公式rpart

只是想连接名称(log_data),log_data是一个包含 60 个不同向量的列表,所以我只希望它们的列名采用某种格式,以便我可以将它们放在 rpart 中的公式中......就像rpart(A ~ B + C + D + E ,log_data),所以在这里,我只想将 formula="A~B+C+D+E" 提取为一个完整的字符串,其中 A,B,C,D,E 是我们必须从 log_data 中提取的列名,或者是否有任何从列表中获取树的更好方法。
我努力了,

收到错误

在哪里

由于列名太长或者可能是 n=60,它在 rpart 进入无限循环

我可以附上任何列名colnames(log_data) <- c(?),我应该在“?”处放什么,这样在 n=60 时很容易绘制它。

0 投票
1 回答
364 浏览

r - R中的分类树

我对 R 完全陌生,我正在尝试利用分类树对一些数据进行分类。让我困惑的是要使用什么库。我应该使用 rpart 还是树?