问题标签 [party]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
695 浏览

r - BinaryTree (ctree, party) 的绘图忽略了 par() 的绘图选项

我想在绘图的上部绘制 BinaryTree,并在第二部分(底部)绘制第二个。这是一些示例代码,树的图完全忽略了由设置的分区选项par()

此代码不会在同一绘图(页面)中绘制两棵树。我该如何纠正?

即使遵循非常详细的答案在这种情况下也不起作用:由'plot'和'ggplot'并排生成的 绘图 ctree 的绘图忽略了所有已建立的选项。

0 投票
1 回答
3001 浏览

r - cforest varimp 似乎不适用于分类预测变量

我正在尝试使用 Party 包运行随机森林模型。我想使用该varimp函数来确定条件变量的重要性,但它似乎不接受分类变量。这是我的数据的链接,下面是我正在使用的代码。

如果我删除factor(Region)变量,则可以计算条件变量的重要性。

这是varimp带有分类预测变量的派对包功能的已知行为吗?从我读过的内容来看,它应该能够处理分类预测变量(随机森林的条件变量重要性 - Strobl 等) - 它没有明确说明varimp(obj, conditional = TRUE)可以与分类预测变量一起使用。

任何见解将不胜感激!

谢谢,

丽莎

编辑:说明如果您在公式之外使用 as.factor 定义变量,则 as.factor 实际上不会生效 - 无论是否将区域指定为因子,结果都是相同的。将这些结果与上面运行的其他 varimp (conditional = false) 进行比较,其中输出将变量显示为“因子(区域)”,而在下面的两次运行中,它只显示为“区域”。

0 投票
4 回答
7434 浏览

r - ctree() - 如何获取每个终端节点的拆分条件列表?

我有一个来自ctree()( partypackage) 的输出,如下所示。如何获取每个终端节点的拆分条件列表,如likesns <= 0, dta <= 1; sns <= 0, dta > 1等?

谢谢

0 投票
1 回答
1059 浏览

r - 如何在 R 包 'party' 中创建 ctree

我想在包'party'中获取R代码的一部分,它创建一个条件推理树。即,指定使用引导样本逐步生长树的方法的代码部分。我检查了函数“ctree”,但它的结构似乎很复杂。甚至我也没有发现诸如示例(所有功能中的 mtry 功能)之类的迹象。有谁知道在哪里可以找到它?或者如何找到它的方法?

0 投票
1 回答
1474 浏览

r - 如何处理派对包中Ctree中的内存问题?

我正在使用 Party R 包的 ctree 方法来生成决策树。

我的数据集大约有 22 列和 650000 行数据。我使用 memory.limit 命令为我的 r 会话分配了 10GB 内存。

我有一个 2.3 GHz i3 处理器和 6GB 内存。我在这里做错了什么。

我得到的错误是

0 投票
1 回答
906 浏览

r - 如何从随机森林中获取树信息,包“派对”

我正在使用 R 包“派对”。有什么方法可以访问单个树的信息吗?比如哪些样本(选择了哪些特征,以及时间)用于创建树,哪些是 OOB 样本,树的 OOB 错误是多少。包“randomForest”似乎提供了部分但不完整的信息。虽然 RF 是一个黑匣子,但我认为它可能会更亮。

0 投票
2 回答
814 浏览

r - 在 R Party Package 中编码多元响应

我希望使用 R 中的派对包进行多变量预测(下面的派对包文档)

http://cran.r-project.org/web/packages/party/party.pdf

但是,我无法弄清楚如何进行多元预测(多个响应变量)。它说它可以做到,我试试这个:

但这会产生以下错误:

[<-( tmp , nas, drop = FALSE, value = 0) 中的错误:(下标)逻辑下标太长

文档说它支持多变量......但没有建议如何正确编写语法,有什么想法吗?

0 投票
1 回答
978 浏览

r - 如何从 `party` 包中的 `ctree()` 构建的回归树中删除某些节点

我已经使用ctree()from package构建了一个回归树party。我的模型的结果有许多节点,其中包含相等概率的因变量(例如:A 类 = 0.33,B 类 = 0.33,C 类 = 0.33)。我想从模型中取出这些节点。该包tree有一个snip.tree()命令,我们可以在其中指定要从模型中删除的节点号。该命令不识别使用ctree(). 请让我知道是否有办法从使用构建的回归树中删除某些节点ctree()

我使用了以下模型:

nn2.rv.mod1$nodes 是一个向量,其中包含要从 rv.mod1 模型中删除的节点。但是我收到一个错误:

0 投票
3 回答
3007 浏览

r - 带有派对包的随机森林无法处理超过 4 个级别的分类预测器

我正在尝试使用该party包运行随机森林模型。我的响应变量(10 个级别)是不同湖泊类型的分类值(感兴趣的是哪些因素会影响基于水质属性的湖泊聚类)。我的预测变量包括连续变量和分类变量。一个分类变量有 4 个级别,另一个分类变量有 8 个级别(美国州湖泊所在的州)。每当我在模型中包含第二个分类变量时,我都会收到以下错误:

我已经能够将其范围缩小到当预测变量具有超过 4 个分类级别时包中的cforest例程party似乎没有运行的事实。我不确定这是否适用于其他数据集或只是我的一个特征。谷歌建议错误代码可能与收敛问题有关。有没有人知道cforest例程中关于分类预测级别的限制(例如randomForest,从randomForest包中限制为 32 个级别)?我还没有看到任何明确的讨论party包裹。一种解决方案是将这个因素重新编码为单独的虚拟变量,但我想避免这种情况。根据我的数据的特征(相关预测变量、不同水平的因素、连续数据和分类数据的混合),cforest似乎推荐超过randomForest.

任何见解将不胜感激。

链接到一个虚拟数据集(真实数据只是有限数量的变量):https ://dl.dropboxusercontent.com/u/8554679/newdata.csv

SessionInfo() 请求:

0 投票
1 回答
621 浏览

r - 从派对包装中打印一棵大树

我已经使用party. R树很好,但它非常大(27 个终端节点)。尝试打印它会导致文件不可读,椭圆形相互重叠。

我怎样才能创造出可读的东西?

我可以打印树的子部分吗?例如,前几个节点的第一页,然后从孙子节点开始的后续页面?

对于可视化这样的树还有其他建议吗?

编辑斯蒂芬要求一个可重复的例子;这是合理的,但在这里很难;变量的相互关系是存在一棵树的关键,而这些很难(至少对我来说!)模拟。此外,有些变量是分类的,有些是连续的。但这是在 R 中打印树结构的输出版本。(我用 V1 等代替变量名)

我希望能对结构有所了解;很多节点!

默认情况下,plotinparty将每个拆分放在一个椭圆中,并为终端节点放置附加信息。但这不适合页面。