问题标签 [decision-tree]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 Python 中打印决策树的递归函数:抑制“无”
我在 Python 中将决策树实现为字典。例子:
我有一个递归函数打印树:
如何抑制运行该函数时打印的 None ?
我尝试返回'',但随后我得到了不需要的额外换行符。我正在从 Programming Collective Intelligence 的第 151 页开始构建“printtree”功能。
matlab - 创建树桩 Matlab
关于如何在 Matlab 中创建用于提升的决策树桩的任何想法?我的意思是我可以发送一些参数到 classregtree 以确保我最终只有 1 个级别?我试过修剪,但它并不总是给树桩(单剪)。有时我只能得到 2 个切口(不平衡的树)。
我知道 ClassificationTree.template 和 fitensemble 函数,但我想编写自己的提升算法以将其与 LDA 或 fitensemble 未提供的其他分类器一起使用。
谢谢
vector - 多目标决策树
这是我的问题。我需要实现一个多目标决策树算法。多目标是多标签学习的扩展,其中标签不是二元的,而是连续的、分类的等。例如,多标签分类问题的标签向量可能看起来像 {1,0,1,0,0,0,1},而多目标可能看起来像 {2,35,3,-2, 24}。我的问题是这个。如果我有一个带有 3 个离散值的标签,我如何在向量中表示它们?假设我有一个名为 job 的标签,它包含 3 个值,即机械师、教师和运动员。我如何编码这个标签以便在向量中使用它?在决策树的每个节点上,为了找到我的拆分,我需要计算该节点中所有标签向量的平均向量(我正在使用方差方法方程来找到我的拆分)。如果我有二进制标签,这将很容易,因为添加 0 和 1 不会造成任何问题。如果我用 0、1、2 对这 3 个工作进行编码,那么这就是问题,因为添加具有标签运动员的标签向量比添加具有工作机制且平均向量不准确的向量更重要。
让我们举这个例子。我有这 3 个标签:
很容易说,已婚标签可以编码为{0,1},而年龄标签可以编码为连续数字。但是我如何编码工作标签?将其编码为 {0,1,2} 会导致下一个问题。想象一个节点中有 2 个标签向量:{0,0,45} 对应于 mechanic,married 和 45 岁,{2,1,48} 对应于运动员,未婚,45 岁。平均向量是 {1,0.5,46.5}。有了这个向量,我可以预测落入该节点的实例的年龄是 46.5,我可以说未结婚的实例(使用大于或等于 0.5 的规则是 1),我可以说它的工作是老师。老师的工作完全错了,而其他人都还好。您现在看到了编码分类标签的问题。帮助或建议???感谢:D
classification - 修剪决策树
当训练集中的示例太少时,如何使用 ID3 修剪决策树构建。
我不能把它分成训练、验证和测试集,所以这是不可能的。
是否有任何可能使用的统计方法或类似的方法?
weka - 关于从命令行显示分类/决策树的方法?
在 Weka 中,如何从命令行显示分类/决策树?
xcode - 如何在 Cocoa 中创建大型决策树
我正在开发一个 iOS 应用程序,我需要用户能够通过决策树选择某个报告的主题(使用UITableView
来推进可用选项)。我正在尝试找到一种订购所有可用选项的好方法,其中一些层大约有 5 层和 10 多个项目。
- 橱柜
- 木制的
- 黑色的
- 闪亮的
- 没有光泽
- ETC
- 黑色的
- 棕色的
- ETC
- 白色的
- ETC
- 木制的
- 钢
- ETC
- 织物
- ETC
任何人都可以建议使用某种变量类型来执行此操作吗?我曾考虑过使用 aNSMutableArray
并用指向其他数组等的指针填充它,但我认为我最终会得到一大堆指针,但最终只有实际NSStrings
返回(如果这有任何意义的话)。
algorithm - 制定复杂决策树的提示/技巧
如果您要使用 3 个变量:a、b、c,我正在尝试从中制定决策树。
这只是一个简单的选择排序,但实际上跟踪所有变量非常困难。我可以相当容易地完成大多数简单的决策树,但是使用这个应该非常简单,但确实很难。
任何人都可以给我任何关于这样做的提示或技巧吗?
data-visualization - 可视化 Weka 分类树
我正在使用一些在线可用的数据集并尝试可视化树。但是,它根本不允许我想象树选项。谁能指导我如何使用在线可用的数据集在 weka 中获取树形图?
r - 具有强制结构的决策树
我一直在使用 rpart 包在 R 中使用决策树(CART)来查看 SST(预测变量)和气候(预测变量)之间的关系。
我想将树“强制”成一个特定的结构——即在预测变量 1 上拆分,然后在变量 2 上拆分。
我使用 R 已经有一段时间了,所以我想我可以查看 rpart 函数背后的代码并对其进行修改以首先在特定的预测变量中搜索“最佳分割”。然而,rpart 函数调用 C 例程并且没有任何 CI 经验在这里迷失了......
我可以从头开始编写一个函数,但如果可能的话想避免它!所以我的问题是:
- 是否有另一种决策树技术(最好在 R 中实现)可以强制树的结构?
- 如果没有 - 有什么方法可以将 C 代码转换为 R 吗?
- 还有其他想法吗?
在此先感谢,非常感谢您的帮助。
decision-tree - 如何使用决策树对该值进行分类
基本上,我的决策树无法使用普通算法对值进行分类。
我到达一个节点,有两个选项(例如,晴天和有风),但在这个节点上,我的值是不同的(例如,下雨天)。
有什么方法可以解决这个问题,例如更改树或仅根据其他数据进行估计?
我正在考虑在该节点上分配最常见的值,但这只是一个猜测。