问题标签 [party]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 提取partykit中终端节点的信息:ctree具有大量多元响应
我正在使用partykit:ctree 来探索我的数据集,该数据集包含大约 15,000 个海滩调查,调查了从 50 个不同类别中发现的碎片数量。数据中有很多零,并且碎片总量分布很大。我还有一系列自变量,包括一些因素,一些计数数据,还有一些连续数据。
这是一个非常小的样本数据集:
我使用以下代码对数据进行分区:
这产生了一个可爱的图表,但我如何提取每个终端节点的成员资格?如果只有几个项目,我可以在图表中看到它,但是一旦可能的类别数量增加到 50,就很难以图形方式查看它。我想查看节点中包含的信息;特别是每个终端节点中包含的每个单独类别的相对概率。
我知道如果这是一个 BinaryTree 类,我可以使用节点参数,但是当我查询类(M.2)时,它告诉我它来自 constaparty 类,我无法找到如何获取来自此类的节点信息。
我还遇到了一个次要问题,那就是当我在我的样本数据集上运行 ctree 时,它每次都会崩溃 R!它适用于我的实际数据集,但我无法弄清楚样本集有什么问题。
编辑:所需的输出将类似于以下内容:
节点 15:
硬塑料 30
玻璃 5
软塑料 23
塑料袋 6
碎片 12
r - varimp(R 方)仅返回零
varimp()
我对派对包中的功能行为感到困惑。
我正在使用条件随机森林来获得 Strobl 等人的变量重要性。2009 年的建议。
它适用于我所有的数据集,但只有一个。我必须将我的观察进行子集化。但是,即使条件随机森林在完整数据集上正常运行,它也只为子集返回零......并且似乎根本不运行,但不会产生错误。
我想知道预测变量的数量是否太多,只能进行少量观察,并尝试仅使用有限数量的预测变量,但它给了我相同的结果。正如在其他情况下指出的那样,它似乎也没有链接到变量类型......
我显然错过了一些东西,但我就是不知道是什么......
如果有人对我应该关注的方向有所了解,我将不胜感激。
我的数据在这里。
r - cforest:当 newdata 是单行数据帧时,预测错误
您好,我正在使用包partykit
及其功能cforest
来拟合模型。我还可以使用predict
基于多行数据帧的预测。但是,我无法预测只有一行的数据框。
错误信息是:
预测(obj,newdata=df[5,])向量中的错误(模式 =“列表”,长度 = ncol(w)):无效的“长度”参数
r - 将 mob() 树(partykit 包)与 nls() 模型一起使用
我正在尝试将基于模型的递归分区(MOB)与mob()
函数(来自partykit
包)一起使用,以分离使用该nls()
函数派生的几条曲线。我必须定义我的模型并确定起始值。我一直在尝试查看是否可以将其与该mob()
功能一起使用,但无济于事。
我尝试在第 7 页上遵循此示例:
https ://cran.r-project.org/web/packages/partykit/vignettes/mob.pdf
我创建了一个拟合函数来估计起始值并返回估计值等nls()
. _ 但在那之后我似乎什么也做不了。我想知道是否可以使用带有系数以及因变量和自变量的自定义模型,并将它们包含在内mob()
并使其正常工作。我试过这个lmtree()
功能,但当然这只会给出一条直线。
我的代码如下。基本上,我使用分段线性回归来获取我正在使用的双指数曲线的起始值。这基本上是我得到的最远的。参数估计会给出错误等,如果你甚至超过它就不会运行。我只需要知道该mob()
功能是否可以运行nls()
。
我加载了示例数据,但如果可以使用nls()
这是我的示例数据:
r - 如何将“RWeka”决策树转换为 R 中的“派对”树?
我正在使用 R 中的 RWeka 包将 M5' 树适合使用“M5P”的数据集。然后我想将生成的树转换为“派对”树,以便我可以访问变量重要性。as.party
我遇到的问题是,如果没有出现以下错误,我似乎无法使该功能正常工作:
仅当我在 for 循环中应用该函数时才会出现此错误,但 for 循环是必要的,因为我正在运行 5 折交叉验证。
下面是我一直在运行的代码:
r - 决策树方包预测错误 - 级别不匹配
我正在使用派对包在 R 中构建 CART 回归树模型,但是当我尝试将模型与测试数据集应用时,我收到错误消息说级别不匹配。
在过去的一周里,我一直在阅读论坛上的帖子,但仍然找不到解决我问题的正确方法。所以我在这里使用我编造的假例子重新发布这个问题。有人可以帮助解释错误消息并提供解决方案吗?
我的训练数据集有大约 1000 条记录,测试数据集有大约 150 条记录。两个数据集中都没有 NA 或空白字段。
我在派对包下使用 ctree 的 CART 模型是:
mytree<- ctree(Rate~Bank+Product+Salary, data=data_train)
数据训练示例:
数据测试示例:
我尝试使用以下代码设置为同一级别:
但是,当我尝试对测试数据集运行预测时,出现以下错误:
我也尝试了以下方法,但它改变了我的测试数据集的字段......:
级别(data_test$Bank)<-级别(data_train$Bank)
data_test 表已更改: