问题标签 [rpart]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
124 浏览

r - In R build a tree and find the Cost of each branch

I am new to the R thing.

I have been building this decision tree in TreeAge and it's OK. Now, i have this Tree here:

I have this decision to make:

The values below are the probabilities for each decision... could you please give me a hand on how to build this tree, i sincerely have no clue, even after going 1 week on reading..

I read about decision trees, how to prune them, about rpart, cran etc...

Thanks in advance..

0 投票
1 回答
1367 浏览

r - R中决策树的参数

下面是决策树的部分输出。想知道“yval”是什么意思

谢谢

0 投票
1 回答
1389 浏览

r - rpart 模型在插入符号中折叠为零分裂

我正在使用 rpart 在 caret 包中运行回归树分析,使用 oneSE 选项进行选择功能。当我这样做时,我经常会得到一个零分裂的模型。它表明没有模型会比任何模型更好。这应该发生吗?

这是一个例子:

这是模型输出:

这是 printcp 的输出:

但是,如果我直接在 rpart 中运行模型,我可以看到更大的、未修剪的树,它被修剪为上面所谓的更简约的模型:

Caret [我认为] 试图找到最小的树,其 RMSE 在具有最低 RMSE 的模型的 1 SD 范围内。这类似于 Venebles 和 Ripley 提倡的 1-SE 方法。在这种情况下,即使没有解释力,选择没有拆分的模型似乎也会陷入困境。

这是正确的吗?这个可以吗?似乎应该有一条规则来防止选择没有拆分的模型。

0 投票
2 回答
9890 浏览

r - 有人可以解释一下 ID3 和 CART 算法之间的区别吗?

我必须使用 R 软件和 rpart 包创建决策树。在我的论文中,我应该首先定义 ID3 算法,然后实现各种决策树。

我发现 rpart 包不适用于 ID3 算法。它使用 CART 算法。我想了解其中的差异,并可能在我的论文中解释差异,但我没有找到任何比较双方的文献。

你能帮助我吗?你知道一篇比较两者的论文吗,或者你能向我解释一下区别吗?

0 投票
1 回答
315 浏览

r - R中的数值比较精度;在函数之间传递值

看了这个问题后:R中的数值比较困难

我仍然卡住了,因为我依赖于在某些我无法编​​辑的函数中进行的等式比较(或者我可以吗?)

我在本地环境中测试三个数字的总和是否等于一个sum(p)==1 --> TRUE(功能到下一个 - 这可能吗?

更多细节:我正在尝试“优化”输入 CART 模型的先验概率,使用优化器 ( dfoptim package, nmkb) 选择先验组合,将它们发送到 rpart 包进行模型拟合,然后验证(rps函数)包得分 - 但在rpart包的某个地方,我的先验概率抛出了一个错误,因为rpart认为它们的总和等于 1。

这是一个可重现的示例:

运行这段代码给了我这个输出:

在我的真实代码中,这种情况不一致地发生,具体取决于数据和猜测值,但它确实发生了,而且真的很痛苦。

我怎样才能克服这个错误?干杯,R

0 投票
0 回答
1386 浏览

r - 在 R 中使用 RPART 进行预测

我有一个训练集列表(每个都有 944 个实例)和一个测试集列表(每个都有 188 个实例)。我想从我的第一个训练集制作一个模型并在我的第一个测试集上对其进行测试。我有以下代码:

但是当我用 控制我RPART_testpredictions的时 length(RPART_testpredictions),我变成了 944。

有人能帮我吗?

0 投票
3 回答
41033 浏览

r - rpart 的结果只有 1 个根

在我的数据集中,泄漏有两个值 1,0。只有大约 300 行有 1,另外 569378 行中有 1。这就是我在 rpart 结果中只有 1 个根的原因。

我该如何解决这个问题?

0 投票
1 回答
2698 浏览

r - rpart.control minsplit 不改变树

我正在玩rpart。我正在使用一个有 5000 行的银行的游戏数据集,有 7 个 IV,并且该类有 2 个因素。

原始模型是(没有设置控制参数):

然后我在 rpart.plot 中创建一棵树,没有问题。

然后我尝试通过添加一些控制参数来修剪树:

我绘制了修剪过的树,它看起来与第一棵树相同。我不断更改 minsplit(甚至高达 1000),以查看它何时更改。树永远不会改变。

但是,当我将 cp 更改为 .05 时,树会发生变化。

那么为什么 minsplit 不修剪树。我没有正确使用它吗?

0 投票
1 回答
5296 浏览

r - rpart中plotcp结果的含义是什么?

有人知道水平线是什么意思吗?我在 R 中得到了解释:

什么是1SE??

0 投票
1 回答
1797 浏览

r - 方差分析树和类 rpart

我正在尝试使用 rpart 函数找到切点,而我的响应变量是二进制的。当我使用 anova 方法时,它给出了一组分离,而当我使用类方法时,我什么也得不到。谁能告诉我为什么会这样,并且 anova 的分离对于二进制变量仍然是一个很好的分割吗?谢谢。