问题标签 [cart-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rpart“as.character(x) 中的错误:无法将'builtin' 类型强制转换为'character' 类型的向量”消息是什么意思?
rpart
几天来我一直在努力(试图为我拥有的这个数据集制作分类树),我认为现在是时候询问生命线了 :-) 我确信这很愚蠢我没有看到,但这是我一直在做的事情:
对于我的一生,我无法弄清楚错误是关于什么的。
r - “anova”(对于 lm)是否与 rpart 对象等价?
使用 R 的rpart
函数时,我可以很容易地用它拟合模型。例如:
我的问题是 - 如何衡量我的三个解释变量(年龄、数字、开始)中的每一个对模型的“重要性”?
如果这是一个回归模型,我可以从“anova”F 检验中查看 p 值(在lm
有和没有变量的模型之间)。但是在物体上使用“anova”的等价物是lm
什么rpart
?
(我希望我能把我的问题说清楚)
谢谢。
r - 在 R 中构建分类树时,如何解释因子变量上的 rpart 拆分?
如果因子变量是气候,有 4 个可能的值:热带、干旱、温带、雪,并且我的rpart
树中的一个节点被标记为“气候:ab”,那么拆分是多少?
r - 使用 rpart 在回归树中搜索相应的节点
我对 R 很陌生,我遇到了一个非常愚蠢的问题。
我正在使用rpart包校准回归树,以便进行一些分类和一些预测。
多亏了 R,校准部分易于操作且易于控制。
在校准了一个大决策树之后,我希望为给定的数据样本找到一些新数据的相应集群(以及预测值)。
该predict
功能似乎非常适合需要。
但是,使用该predict
方法,我只能获得新元素的预测比率,并且找不到获取新元素所属的决策树叶的方法。
我认为它应该很容易得到,因为 predict 方法必须找到那个叶子才能返回比率。
有几个参数可以通过class=
参数传递给 predict 方法,但是对于回归树来说似乎都返回相同的东西(决策树的目标属性的值)
有谁知道如何获取决策树中的相应节点?
通过使用该path.rpart
方法分析节点,这将有助于我理解结果。
r - 可以处理 NA 的 R 包/模型
我正在寻找可以处理 NA 的 R 包或机器学习模型/算法(如randomForest
、glmnet
、gbdt
等),而不是忽略具有任何 NA 实例的行或列。我不想推卸责任。有什么建议么?
r - 具有强制结构的决策树
我一直在使用 rpart 包在 R 中使用决策树(CART)来查看 SST(预测变量)和气候(预测变量)之间的关系。
我想将树“强制”成一个特定的结构——即在预测变量 1 上拆分,然后在变量 2 上拆分。
我使用 R 已经有一段时间了,所以我想我可以查看 rpart 函数背后的代码并对其进行修改以首先在特定的预测变量中搜索“最佳分割”。然而,rpart 函数调用 C 例程并且没有任何 CI 经验在这里迷失了......
我可以从头开始编写一个函数,但如果可能的话想避免它!所以我的问题是:
- 是否有另一种决策树技术(最好在 R 中实现)可以强制树的结构?
- 如果没有 - 有什么方法可以将 C 代码转换为 R 吗?
- 还有其他想法吗?
在此先感谢,非常感谢您的帮助。
r - R:预测因子中超过 52 个级别,为打印而截断
嗨,我是 R 编程语言的初学者。我使用 rpart 包为回归树编写了一个代码。在我的数据中,我的一些自变量有 100 多个级别。运行 rpart 函数后,我收到以下警告消息“预测因子中超过 52 个级别,为打印而截断”并且我的树以非常奇怪的方式显示。例如,我的树按位置拆分,大约有 70 个不同的级别,但是当标签显示在树中时,它会显示“ZZZZZZZZZZZZZZZZ......”我没有任何位置叫“ZZZZZZZZ”
请帮我。
提前致谢。
r - 二叉决策树(CART)的分裂和根节点
如何在回归树中找到拆分和根节点,我从多个向量制作了一个回归树,现在我必须提取多个向量的 rpart 的根节点。文件包含多个向量的数值A
, B
, C
, D
, E
, F
, G
, H
ex。一个向量包含 4,3,6,7,2,4,5,... 等类似其他 B,C,D,E,F,G,H .so 想要提取F
(这是一个根节点我的情况)作为此输入的输出,在创建一棵树之后。谢谢。抱歉无法放置任何图像:(
这是我到目前为止所做的
F(F>=5.5)
......现在我必须从拟合(回归树)及其拆分中提取根节点,有人可以帮助我吗?
r - 为 rpart 制定数据
连接列表的列名称以准备公式rpart
?
只是想连接名称(log_data),log_data
是一个包含 60 个不同向量的列表,所以我只希望它们的列名采用某种格式,以便我可以将它们放在 rpart 中的公式中......就像rpart(A ~ B + C + D + E ,log_data)
,所以在这里,我只想将 formula="A~B+C+D+E" 提取为一个完整的字符串,其中 A,B,C,D,E 是我们必须从 log_data 中提取的列名,或者是否有任何从列表中获取树的更好方法。
我努力了,
收到错误
在哪里
由于列名太长或者可能是 n=60,它在 rpart 进入无限循环
我可以附上任何列名colnames(log_data) <- c(?),我应该在“?”处放什么,这样在 n=60 时很容易绘制它。
r - R中的分类树
我对 R 完全陌生,我正在尝试利用分类树对一些数据进行分类。让我困惑的是要使用什么库。我应该使用 rpart 还是树?