问题标签 [party]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - BinaryTree (ctree, party) 的绘图忽略了 par() 的绘图选项
我想在绘图的上部绘制 BinaryTree,并在第二部分(底部)绘制第二个。这是一些示例代码,树的图完全忽略了由设置的分区选项par()
此代码不会在同一绘图(页面)中绘制两棵树。我该如何纠正?
即使遵循非常详细的答案在这种情况下也不起作用:由'plot'和'ggplot'并排生成的 绘图 ctree 的绘图忽略了所有已建立的选项。
r - cforest varimp 似乎不适用于分类预测变量
我正在尝试使用 Party 包运行随机森林模型。我想使用该varimp
函数来确定条件变量的重要性,但它似乎不接受分类变量。这是我的数据的链接,下面是我正在使用的代码。
如果我删除factor(Region)
变量,则可以计算条件变量的重要性。
这是varimp
带有分类预测变量的派对包功能的已知行为吗?从我读过的内容来看,它应该能够处理分类预测变量(随机森林的条件变量重要性 - Strobl 等) - 它没有明确说明varimp(obj, conditional = TRUE)
可以与分类预测变量一起使用。
任何见解将不胜感激!
谢谢,
丽莎
编辑:说明如果您在公式之外使用 as.factor 定义变量,则 as.factor 实际上不会生效 - 无论是否将区域指定为因子,结果都是相同的。将这些结果与上面运行的其他 varimp (conditional = false) 进行比较,其中输出将变量显示为“因子(区域)”,而在下面的两次运行中,它只显示为“区域”。
r - ctree() - 如何获取每个终端节点的拆分条件列表?
我有一个来自ctree()
( party
package) 的输出,如下所示。如何获取每个终端节点的拆分条件列表,如likesns <= 0, dta <= 1; sns <= 0, dta > 1
等?
谢谢
r - 如何在 R 包 'party' 中创建 ctree
我想在包'party'中获取R代码的一部分,它创建一个条件推理树。即,指定使用引导样本逐步生长树的方法的代码部分。我检查了函数“ctree”,但它的结构似乎很复杂。甚至我也没有发现诸如示例(所有功能中的 mtry 功能)之类的迹象。有谁知道在哪里可以找到它?或者如何找到它的方法?
r - 如何处理派对包中Ctree中的内存问题?
我正在使用 Party R 包的 ctree 方法来生成决策树。
我的数据集大约有 22 列和 650000 行数据。我使用 memory.limit 命令为我的 r 会话分配了 10GB 内存。
我有一个 2.3 GHz i3 处理器和 6GB 内存。我在这里做错了什么。
我得到的错误是
r - 如何从随机森林中获取树信息,包“派对”
我正在使用 R 包“派对”。有什么方法可以访问单个树的信息吗?比如哪些样本(选择了哪些特征,以及时间)用于创建树,哪些是 OOB 样本,树的 OOB 错误是多少。包“randomForest”似乎提供了部分但不完整的信息。虽然 RF 是一个黑匣子,但我认为它可能会更亮。
r - 在 R Party Package 中编码多元响应
我希望使用 R 中的派对包进行多变量预测(下面的派对包文档)
http://cran.r-project.org/web/packages/party/party.pdf
但是,我无法弄清楚如何进行多元预测(多个响应变量)。它说它可以做到,我试试这个:
但这会产生以下错误:
[<-( tmp , nas, drop = FALSE, value = 0) 中的错误:(下标)逻辑下标太长
文档说它支持多变量......但没有建议如何正确编写语法,有什么想法吗?
r - 如何从 `party` 包中的 `ctree()` 构建的回归树中删除某些节点
我已经使用ctree()
from package构建了一个回归树party
。我的模型的结果有许多节点,其中包含相等概率的因变量(例如:A 类 = 0.33,B 类 = 0.33,C 类 = 0.33)。我想从模型中取出这些节点。该包tree
有一个snip.tree()
命令,我们可以在其中指定要从模型中删除的节点号。该命令不识别使用ctree()
. 请让我知道是否有办法从使用构建的回归树中删除某些节点ctree()
我使用了以下模型:
nn2.rv.mod1$nodes 是一个向量,其中包含要从 rv.mod1 模型中删除的节点。但是我收到一个错误:
r - 带有派对包的随机森林无法处理超过 4 个级别的分类预测器
我正在尝试使用该party
包运行随机森林模型。我的响应变量(10 个级别)是不同湖泊类型的分类值(感兴趣的是哪些因素会影响基于水质属性的湖泊聚类)。我的预测变量包括连续变量和分类变量。一个分类变量有 4 个级别,另一个分类变量有 8 个级别(美国州湖泊所在的州)。每当我在模型中包含第二个分类变量时,我都会收到以下错误:
我已经能够将其范围缩小到当预测变量具有超过 4 个分类级别时包中的cforest
例程party
似乎没有运行的事实。我不确定这是否适用于其他数据集或只是我的一个特征。谷歌建议错误代码可能与收敛问题有关。有没有人知道cforest
例程中关于分类预测级别的限制(例如randomForest
,从randomForest
包中限制为 32 个级别)?我还没有看到任何明确的讨论party
包裹。一种解决方案是将这个因素重新编码为单独的虚拟变量,但我想避免这种情况。根据我的数据的特征(相关预测变量、不同水平的因素、连续数据和分类数据的混合),cforest
似乎推荐超过randomForest
.
任何见解将不胜感激。
链接到一个虚拟数据集(真实数据只是有限数量的变量):https ://dl.dropboxusercontent.com/u/8554679/newdata.csv
SessionInfo() 请求:
r - 从派对包装中打印一棵大树
我已经使用party
. R
树很好,但它非常大(27 个终端节点)。尝试打印它会导致文件不可读,椭圆形相互重叠。
我怎样才能创造出可读的东西?
我可以打印树的子部分吗?例如,前几个节点的第一页,然后从孙子节点开始的后续页面?
对于可视化这样的树还有其他建议吗?
编辑斯蒂芬要求一个可重复的例子;这是合理的,但在这里很难;变量的相互关系是存在一棵树的关键,而这些很难(至少对我来说!)模拟。此外,有些变量是分类的,有些是连续的。但这是在 R 中打印树结构的输出版本。(我用 V1 等代替变量名)
我希望能对结构有所了解;很多节点!
默认情况下,plot
inparty
将每个拆分放在一个椭圆中,并为终端节点放置附加信息。但这不适合页面。