问题标签 [rpart]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
3344 浏览

r - 在 rpart 模型中应用权重会产生错误

我正在使用该rpart软件包来安装某些模型,例如:

调用自定义函数

这会导致错误:

Error in eval(expr, envir, enclos) : object 'w' not found

然后我决定使用

这可行,但还有另一个问题:

这将起作用

这不起作用

Error in eval(expr, envir, enclos) : object 'w' not found

在自定义函数中应用权重的正确方法是什么?谢谢!

0 投票
1 回答
2828 浏览

r - rpart plot text shorter

I am using the prp function from the rpart.plot package to plot a tree. For categorical data like states, it gives a really long list of variables and makes it less readable. Is there any way to wrap text to two or more lines if exceeds some length?

0 投票
2 回答
2113 浏览

r - 使用 train 命令通过 CrossValidation 构建 CART 模型时出现预测功能问题

我正在尝试使用“caret”包的 train 功能通过交叉验证来构建 CART 模型。

我的数据是 4500 x 110 数据框,其中所有预测变量(除了我不用于模型构建的前两个,UserId 和 YOB(出生年份))都是具有 2 个级别的因子,但因变量是类型整数(虽然只有两个值 1 和 0)。性别是自变量之一。

当我运行 rpart 命令来获取 CART 模型(使用包“rpart”)时,我对 predict 函数没有任何问题。但是,我想通过交叉验证来改进模型,因此使用包“caret”中的 train 函数和以下命令:

这将使用以下警告构建模型

但它确实给了我一个最终模型(best.tree)。但是,当我尝试使用以下命令运行预测函数时:

在测试数据上,它给了我以下错误:

性别变量有两个值:女性、男性

谁能帮我理解错误

0 投票
1 回答
667 浏览

r - RPART - 特征类型

RPART 对连续变量、有序变量和分类变量使用不同的拆分过程。有没有办法“通知” RPART 关于变量类型?为了说明,我有一个带有整数值的序数变量 (1,..,5)。现在,我需要将它强制转换为字符,这样 RPART 就不会像连续变量一样拆分它。

我想避免更改我所有的变量类型,只是为了 RPART。我宁愿以某种方式宣布它。

谢谢。

0 投票
1 回答
197 浏览

r - 每次观察可以获取超过 1 个预测的分类树

我正在从分类树算法家族中搜索一个算法,它可以为每个观察提供多个(超过 1 个)预测(以某种排序顺序)。更具体地说 - 我有 10 个二元目标模型来预测具有 10 个级别的目标变量。如何以这种方式组合模型以获取具有置信度的预定义数量的预测。例如,我希望我的“组合”模型为每次观察获取 2 个预测。一种可能的方法是采用针对特定观察具有最高准确度的 2 个二元模型并获取它们。如何计算这组 2 个预测的“平均”准确度?如果有人可以提供 rpart 包中的文献和 R 代码示例,那将更有帮助。谢谢

0 投票
0 回答
439 浏览

r - R Shiny:布尔值的“可变长度不同”错误,checkboxInput()

我正在尝试创建一个使用 rpart() 构建树图的闪亮应用程序。我正在使用 12 个预测器,我想通过 checkboxInput() 值指定每个预测器的使用。我知道每个 checkboxInput 的值都是布尔值。通常,当我将 TRUE 或 FALSE 乘以我的一个预测变量以指定使用该预测变量时,rpart() 会起作用。我不断收到以下错误:

model.frame.default 中的错误(公式 = 结果〜(input$Pred1 * meanrecchrge)+:可变长度不同(为 'input$Pred1' 找到)

用户界面

服务器.R

0 投票
2 回答
1079 浏览

r - 如何让 rpart 在相对较大的行数(~100k)上工作?

我对我的简单但有点大的数据集有聚类需求。它有 3 列和大约 120k 行,而且所有数据都是数字。我尝试使用 rpart 但得到了这个可爱的错误。

该功能也没有古怪的东西。

我对 1k 行没有问题。它在 10k 行中有点慢,但仍然有效。数据集中没有 NA 值。目前在 Macbook Air 上尝试,但也会在 Mac Mini 上尝试。

我怀疑这是内存问题,但警告信息与我有关。是否有一些解决方法可以使集群工作?

0 投票
2 回答
1548 浏览

r - 在数据框中查找通过树模型中节点规则的数据元素?

所以我使用 rpart 包创建了一个树模型,我发现了一个有趣的规则,并想知道是否有一种简单的方法可以查看该数据框中的哪些观察结果通过了该规则。

使用 path.rpart 查找它沿树所走的路径似乎非常繁琐,然后手动将这些过滤器输入到数据框中以查找它们。有没有一种方法可以传递树和/或节点以及数据帧并返回该帧中在该节点处结束的所有元素?

0 投票
1 回答
2987 浏览

r - 如何计算 R 中的决策树规则

我使用 RPart 来构建决策树。没有问题,我正在这样做。但是,我需要了解(或计算)树被分割了多少次?我的意思是,树有多少条规则(if-else 语句)?例如:

有3条规则。

当我写摘要(模型)时:

摘要(model_dt)

如果有人帮助我理解它,我将不胜感激

真诚的埃雷

0 投票
1 回答
3439 浏览

r - rpart - 如何定义要交叉验证的 cp 值

我正在使用 R 中的 rpart 函数开发回归模型。此函数对参数 cp 进行交叉验证。

有没有办法控制 cp 的哪些值以及交叉验证的数量?