问题标签 [cart-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
152 浏览

python - 编写用于创建决策树的程序的步骤是什么?

我想知道在 Python 中创建决策树 (ID3) 的步骤是什么?看起来像下面的东西?(是不是很多 if then else 还是比这更好?)另外,为了创建如下所示的 ID3 树,我应该计算熵吗?如何?

0 投票
0 回答
17 浏览

machine-learning - 对于随机森林,选择 minchilds 分布而不是常数有什么影响?

在构建随机森林时,选择 minchilds 分布而不是常数有什么影响?通常,您会选择一个恒定的 minchild,例如 5。但是,在难以选择确定最佳 minchild 的环境中,简单地使用 minchild 的分布是否常见?因此,如果您有 1000 棵树,则可能有 100 棵是 minchild=3、100 棵是 minchild=5、100 棵是 minchild=7,……等等。或者你实际上可以从某个分布中画出minchild。有没有人听说过这种做法或知道有关它的论文/研究?

0 投票
1 回答
2715 浏览

python - 从决策树中获取分类概率

我正在实现基于 CART 算法的决策树,我有一个问题。现在我可以对数据进行分类,但我的任务不仅仅是对数据进行分类。我希望在端节点中有正确分类的概率。例如。我有包含 A 类和 B 类数据的数据集。当我将某个类的实例放入树中时,我想查看该实例属于 A 类和 B 类的概率。我该怎么做?如何改进 CART 以在端节点中具有概率分布?

0 投票
1 回答
438 浏览

r - predict() 函数的奇怪行为

我目前正在学习 Coursera 的“实用机器学习”课程,并且在使用 predict 函数时遇到了一些奇怪的行为。已经提出的问题是训练一棵树,然后做出一些预测。所以我不在这里发布答案,我已经更改了用于该问题的数据集。代码如下:

在上面的代码中,有两个主要部分。第一个构建树,第二个(从哪里sampleData开始)创建一个小样本数据集以应用模型。为了确保我具有与原始数据完全相同的结构,我只需复制训练数据集的第一行,然后将所有列设置为NA. 然后,我只将数据放入决策树需要的列中(在本例中为wt变量)。

当我执行上面的代码时,我得到以下结果:

作为参考,下面是树的结构:

在此处输入图像描述

有人可以帮我理解为什么该函数没有返回我提供predict的预测值吗?sampleData

0 投票
2 回答
1807 浏览

r - rpart 没有构建完整的树——cp 有问题吗?

我正在尝试通过将 control 设置为来构建完整的树rpart.control(minsplit=2, minbucket = 1,cp=0),但它不起作用。我认为原因可能是具有 4 个拆分的摘要树cp= 0,但是这棵树不完整,所以它cp应该 > 0。
我还检查了数据,并且可以进行更多拆分。这是我的代码:

0 投票
1 回答
4212 浏览

r - R ctree 奇怪的错误

我在带有 ctree 数据的 for 循环中有一些奇怪的问题。如果我在循环中编写此代码,则 R 会冻结。

有时我会收到一个错误:“预测因子中超过 52 个级别,为打印而截断”并且我的树以非常奇怪的方式显示。有时工作得很好。真的,真的很奇怪!

我的循环代码:

0 投票
1 回答
122 浏览

machine-learning - RF 和 CART 最佳树中每棵树的主要区别?

RF 中的每棵树与 CART 中的最佳树之间的主要区别?

0 投票
2 回答
815 浏览

r - 将信息添加到树 - Rpart

我想在我的树中添加一些信息。例如,假设我有一个这样的数据库:

我可以运行一棵树:

结果如下所示: 在此处输入图像描述

这对我来说没问题,但假设我想知道每片叶子的平均曝光量。

我知道我可以向 prp 添加一些信息,例如每片叶子的重量和一个函数:

在此处输入图像描述

但它只有在框架中计算时才有效,即 rpart 函数的结果。

我的问题 :

如何将自定义信息添加到绘图中,例如平均曝光率或任何其他计算自定义指标并将其添加到表中的函数frame

0 投票
0 回答
383 浏览

hana - SAP HANA PAL CART,计划在非活动后终止

我正在使用 HANA PAL CART 功能,在某些数据集上出现以下错误:

[2629] 执行者:计划在太长时间不活动后内部终止

这可能是什么原因?可能有超时吗?

如果我在 R 中尝试相同的数据集,它运行良好。

0 投票
0 回答
756 浏览

r - R randomForest - 如何使用“getTree”树进行预测

背景:
我可以在 R 中创建一个随机森林:

我可以使用我刚刚制作的 randomForest 对象来预测值:

然后我可以从森林中随机剥下一些树:

问题:

  • 我如何预测从森林中拔出的一棵树?
  • 我应该使用不同的库吗?(森林,派对,水,...)

到目前为止我看过的地方:

  • 我尝试了经典的 randomForest,但没有“unget”或“predict on get”。有“成长”,但它使用骰子制作了一个新的随机森林,而不是使用特定的树。有“组合”,但它适用于 randomForest 对象,而不是从“getTree”返回的内容。
  • 我尝试将多棵树打包到一个对象中,但没有成功——我对将这些数据缝合在一起的数据的理解还有改进的空间。
  • 我尝试查看派对/cforest 的代码,但据称它是用 ctree 制作的,但文档中没有“getTree”。
  • 我尝试了一些谷歌搜索,但没有找到关于这个特定任务的任何信息。

我还发现了一般相关的问题,其中(afaict)答案没有回答我的问题:

似乎有一些关于整体统计的内容,以及关于在森林中绘制特定树的形状。似乎没有关于在森林中处理一棵树的问题。