问题标签 [party]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ctree()的终端节点如何提取拆分规则
我有一个数据集,其中包含 6 个分类变量,级别从 5 到 28 不等。我从ctree()(派对包)获得了一个输出,有 17 个终端节点。我遵循了ctree() 中 @Galled 的输入 - 如何获取每个终端节点的拆分条件列表?达到我想要的输出。
但是,我在运行代码后收到以下错误:
我尝试添加这些额外的行:
但到目前为止还没有成功。关于哪里出错的任何指示?
r - 修改 ctree()、partykit 包中的终端节点
我有一个因变量要按决策树分类。它由三类频率组成:738 (19%)、426 (15%) 和 1800 (66%)。正如您想象的那样,预测的类别始终是第三个类别,但树的目的是描述性的,因此实际上并不重要。问题是,当通过函数绘制树时ctree()
(包partykit
) 终端节点显示直方图,显示三个类别的出现概率。我需要修改这个输出:我想获得终端节点内每个类相对于类的绝对频率的出现比例。例如,class1 的 738 名参与者中有多少百分比属于某个终端节点?每个终端节点将显示构成因变量的所有三个类的此值。
下面是一张树图,默认情况下报告终端节点中每个类的流行度。
r - ctree 图的终端节点中的缩放图
我正在尝试缩放出现在 ctree 终端节点中的图。我尝试使用 yscale 参数,但这只是导致超出绘图窗口的绘图
例如:这是两个指数分布的 ctree
现在,如果我尝试将绘图的 y 轴从 0 缩放到 70 以放大箱线图并截断异常值,我可以使用:
这可以缩放 y 轴,但现在绘图超出了绘图框。
抱歉,我会显示图像,但在 stackoverflow 上还没有足够的权限。
感谢您的任何建议
r - 使用 R 闪亮滑块调整派对包 ctree 图的大小
如何使用 R Shiny 中的响应式输入调整 ctree 的输出大小?
我的尝试
用户界面:
服务器:
运行上面的代码,单击按钮后应该会得到一个 ctree。然而,滑块不做任何事情。如果将 renderPlot 的 height 和 width 参数更改为 500 以外的值,则绘图的大小会发生变化。如何将高度和宽度置于滑块的控制之下?
当我尝试height = sliderHeight(), width = sliderWidth()
在最后一行运行服务器时,我得到:
而且我很困惑,因为我使用了反应式表达。
r - 为什么不同的机器学习方法在插入符号中赋予相同的变量重要性?
我正在使用插入符号比较不同的机器学习方法,但尽管这些方法非常不同,但我得到了相同的变量贡献。
vNNet、ctree、enet、knn、M5、pcr、ridge、svmRadial 给出相同的变量贡献。
其中一些将importance = TRUE作为输入:vNNet、enet、knn、pcr、ridge、svmRadial do。其他人生成了一个重要性 = TRUE: ctree, M5 的错误。(错误是“出了点问题;所有 RMSE 度量值都丢失了:”)
我的问题是为什么不同的方法赋予相同的变量重要性?这似乎是错误的,但我看不出我做错了什么。
我正在使用插入符号 6.0-52
r - 如何在 R 中做决策树?
我通常在 SPSS 中做决策树以从 DDBB 获取目标,我做了一些研究,发现有三个包可供 R 使用:tree、party 和 rpart,但哪个更适合该任务?
谢谢!
r - R - as.formula() 不能与 ctree {party} 一起使用?
当我Error: $ operator not defined for this S4 class
尝试ctree
从.party package
as.formula()
下面的例子:
我的最终目的是创建一个遍历列表test
以创建多棵树的函数。
任何想法 ?
r - ctree 中不存在 x 和 y 轴标签
我正在尝试重做我今年夏天做的一个早期的 ctree 项目。当我去绘制结果时,我使用这样的代码:
这运行,然后我去使用这个代码来绘制它:
但是,我没有在 y 轴上得到标签,也没有在终端节点条形图中显示因变量 Y 的水平。Y 有两个级别,“是”或“否”
有任何想法吗?
更新:我在这里放了一个假数据集的链接:
来自 GITHUB的数据
r - R - 派对 - 随机森林计算如何工作?
我正在运行我的第一个随机森林算法cforest()
,使用party package
. 每次我运行 cforest 算法时,RStudio 在发送错误消息后崩溃,"Error: cannot allocate vector of size 927 Kb"
这是一个非常小的向量...
我尝试使用控件,参数非常低以达到其底部,但即使controls = cforest_unbiased(ntree=2, mtry=3)
它仍然崩溃并显示相同的消息。
这是完整的代码行:
为了让您更好地理解发生了什么,我的二进制因变量取值0
并且1
长度为 120k,并且我有 3 个连续的自变量。此外,我在计算期间跟踪了对内存使用的影响,并且在崩溃之前它达到了 RStudio 的 5Gb。
所以,你知道我该如何解决这个问题,还向我解释发生了什么,因为ctree
一个接一个地运行几个是可以的,但是cforest
由两棵树组成的一个就不行。
编辑 :
我通过将训练样本减少 50% 找到了出路,但现在我遇到了同样的问题,在这种情况下,预测在内存使用方面是广泛的,而如果我是正确的,它应该只应用分类规则。这是一个补充问题,但没有回答上一个问题,因为我认为减少训练样本不应该是答案......
编辑 2:
下面是关于我的数据的补充信息: