“party”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

695 浏览

r - BinaryTree (ctree, party) 的绘图忽略了 par() 的绘图选项

我想在绘图的上部绘制 BinaryTree，并在第二部分（底部）绘制第二个。这是一些示例代码，树的图完全忽略了由设置的分区选项par()

此代码不会在同一绘图（页面）中绘制两棵树。我该如何纠正？

即使遵循非常详细的答案在这种情况下也不起作用：由'plot'和'ggplot'并排生成的绘图 ctree 的绘图忽略了所有已建立的选项。

2013-11-27T17:28:45.787

0 投票

1 回答

3001 浏览

r - cforest varimp 似乎不适用于分类预测变量

我正在尝试使用 Party 包运行随机森林模型。我想使用该varimp函数来确定条件变量的重要性，但它似乎不接受分类变量。这是我的数据的链接，下面是我正在使用的代码。

如果我删除factor(Region)变量，则可以计算条件变量的重要性。

这是varimp带有分类预测变量的派对包功能的已知行为吗？从我读过的内容来看，它应该能够处理分类预测变量（随机森林的条件变量重要性 - Strobl 等） - 它没有明确说明varimp(obj, conditional = TRUE)可以与分类预测变量一起使用。

任何见解将不胜感激！

谢谢，

丽莎

编辑：说明如果您在公式之外使用 as.factor 定义变量，则 as.factor 实际上不会生效 - 无论是否将区域指定为因子，结果都是相同的。将这些结果与上面运行的其他 varimp (conditional = false) 进行比较，其中输出将变量显示为“因子（区域）”，而在下面的两次运行中，它只显示为“区域”。

r random-forest party

2013-12-03T06:00:25.223

0 投票

4 回答

7434 浏览

r - ctree() - 如何获取每个终端节点的拆分条件列表？

我有一个来自ctree()( partypackage) 的输出，如下所示。如何获取每个终端节点的拆分条件列表，如likesns <= 0, dta <= 1; sns <= 0, dta > 1等？

谢谢

r decision-tree party

2014-01-29T21:38:36.847

0 投票

1 回答

1059 浏览

r - 如何在 R 包 'party' 中创建 ctree

我想在包'party'中获取R代码的一部分，它创建一个条件推理树。即，指定使用引导样本逐步生长树的方法的代码部分。我检查了函数“ctree”，但它的结构似乎很复杂。甚至我也没有发现诸如示例（所有功能中的 mtry 功能）之类的迹象。有谁知道在哪里可以找到它？或者如何找到它的方法？

r tree package classification party

2014-03-20T15:27:00.620

0 投票

1 回答

1474 浏览

r - 如何处理派对包中Ctree中的内存问题？

我正在使用 Party R 包的 ctree 方法来生成决策树。

我的数据集大约有 22 列和 650000 行数据。我使用 memory.limit 命令为我的 r 会话分配了 10GB 内存。

我有一个 2.3 GHz i3 处理器和 6GB 内存。我在这里做错了什么。

我得到的错误是

r memory party

2014-03-25T13:38:28.093

0 投票

1 回答

906 浏览

r - 如何从随机森林中获取树信息，包“派对”

我正在使用 R 包“派对”。有什么方法可以访问单个树的信息吗？比如哪些样本（选择了哪些特征，以及时间）用于创建树，哪些是 OOB 样本，树的 OOB 错误是多少。包“randomForest”似乎提供了部分但不完整的信息。虽然 RF 是一个黑匣子，但我认为它可能会更亮。

r package random-forest party

2014-03-27T16:22:57.487

0 投票

2 回答

814 浏览

r - 在 R Party Package 中编码多元响应

我希望使用 R 中的派对包进行多变量预测（下面的派对包文档）

http://cran.r-project.org/web/packages/party/party.pdf

但是，我无法弄清楚如何进行多元预测（多个响应变量）。它说它可以做到，我试试这个：

但这会产生以下错误：

[<-( tmp , nas, drop = FALSE, value = 0) 中的错误：（下标）逻辑下标太长

文档说它支持多变量......但没有建议如何正确编写语法，有什么想法吗？

r machine-learning party

2014-05-04T19:49:11.330

0 投票

1 回答

978 浏览

r - 如何从 `party` 包中的 `ctree()` 构建的回归树中删除某些节点

我已经使用ctree()from package构建了一个回归树party。我的模型的结果有许多节点，其中包含相等概率的因变量（例如：A 类 = 0.33，B 类 = 0.33，C 类 = 0.33）。我想从模型中取出这些节点。该包tree有一个snip.tree()命令，我们可以在其中指定要从模型中删除的节点号。该命令不识别使用ctree(). 请让我知道是否有办法从使用构建的回归树中删除某些节点ctree()

我使用了以下模型：

nn2.rv.mod1$nodes 是一个向量，其中包含要从 rv.mod1 模型中删除的节点。但是我收到一个错误：

r decision-tree party

2014-05-08T07:28:52.733

0 投票

3 回答

3007 浏览

r - 带有派对包的随机森林无法处理超过 4 个级别的分类预测器

我正在尝试使用该party包运行随机森林模型。我的响应变量（10 个级别）是不同湖泊类型的分类值（感兴趣的是哪些因素会影响基于水质属性的湖泊聚类）。我的预测变量包括连续变量和分类变量。一个分类变量有 4 个级别，另一个分类变量有 8 个级别（美国州湖泊所在的州）。每当我在模型中包含第二个分类变量时，我都会收到以下错误：

我已经能够将其范围缩小到当预测变量具有超过 4 个分类级别时包中的cforest例程party似乎没有运行的事实。我不确定这是否适用于其他数据集或只是我的一个特征。谷歌建议错误代码可能与收敛问题有关。有没有人知道cforest例程中关于分类预测级别的限制（例如randomForest，从randomForest包中限制为 32 个级别）？我还没有看到任何明确的讨论party包裹。一种解决方案是将这个因素重新编码为单独的虚拟变量，但我想避免这种情况。根据我的数据的特征（相关预测变量、不同水平的因素、连续数据和分类数据的混合），cforest似乎推荐超过randomForest.

任何见解将不胜感激。

链接到一个虚拟数据集（真实数据只是有限数量的变量）：https ://dl.dropboxusercontent.com/u/8554679/newdata.csv

SessionInfo() 请求：

r random-forest party

2014-05-14T00:56:51.903

0 投票

1 回答

621 浏览

r - 从派对包装中打印一棵大树

我已经使用party. R树很好，但它非常大（27 个终端节点）。尝试打印它会导致文件不可读，椭圆形相互重叠。

我怎样才能创造出可读的东西？

我可以打印树的子部分吗？例如，前几个节点的第一页，然后从孙子节点开始的后续页面？

对于可视化这样的树还有其他建议吗？

编辑斯蒂芬要求一个可重复的例子；这是合理的，但在这里很难；变量的相互关系是存在一棵树的关键，而这些很难（至少对我来说！）模拟。此外，有些变量是分类的，有些是连续的。但这是在 R 中打印树结构的输出版本。（我用 V1 等代替变量名）

我希望能对结构有所了解；很多节点！

默认情况下，plotinparty将每个拆分放在一个椭圆中，并为终端节点放置附加信息。但这不适合页面。

r tree party

2014-05-26T18:24:50.870

问题标签 [party]

Reference