问题标签 [decision-tree]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - 使用决策树
我知道 tl;博士;
我会尽量解释我的问题,而不会用大量糟糕的代码来打扰你。我正在做一个学校作业。我们有蓝精灵的照片,我们必须通过前景背景分析来找到它们。我在 java 中有一个决策树,其中包含所有数据(HSV 直方图)1 个单个节点。然后尝试找到最好的属性(从直方图数据)来拆分树。然后执行拆分并创建一个左右子树,数据在两个节点树上拆分。所有数据仍保存在主树中,以便能够计算基尼指数。
因此,在分析蓝精灵 26 分钟后,我的电脑有一棵巨大的树,上面有分裂和其他数据。现在我的问题是,谁能给我一个关于如何分析新图片并确定哪些像素可能是“蓝精灵像素”的全局想法。我知道我必须使用新蓝精灵的 HSV 直方图生成一个新的数据点数组,然后我需要使用生成的树来确定哪些像素属于蓝精灵。
谁能给我一个关于如何做到这一点的指针?
一些额外的信息。
每个决策树对象都有一个拆分对象,该对象具有要拆分的最佳属性、要拆分的值和一个基尼指数。
如果我需要提供任何其他信息,我想听听。
java - Eclipse 插件 - 节点和连接 + 代码生成
我想创建一个建模决策树/图表的 Eclipse 扩展。实际建模将使用图形界面(节点、连接等)完成。我希望这个插件能够根据节点及其互连生成代码。我已经准备好了基本的模型课程;但是,我的图表非常大,仅通过代码很难管理所有连接。我想我会使用 GUI 构建整个图表。当我双击一个连接时,我希望能够覆盖它的一些方法,从而创建一个匿名子类。
我发现GEF在类似的插件中使用。我的目标插件在 GEF 中是否“可行”?你有什么建议吗?
java - 从图表模型生成 Java 代码
在我的应用程序中,我为决策图(节点+连接)建模。我已经准备好模型类(两个基本类:Node
和Connection
+ 特殊情况的子类)。该图变得非常大,仅通过代码跟踪所有连接和节点并不容易(并考虑到未来的维护)。我想知道是否有一个工具(Eclipse 插件或其他)可以提供我的模型类(即节点类型、连接类型),使用它以图形方式“绘制”图表(制作节点和连接)然后生成图的代码?
模型类::
Node
包含List<Connection>
来自此节点的所有连接
Connection
:Node from
,Node to
编辑:
我想生成一个初始化所有需要的节点和连接(Node
和Connection
对象)并返回头/开始节点的方法。然后,应用程序在做出决策时会遍历此内存结构。
machine-learning - 训练和测试集在构建决策树和使用它进行分类中的作用
我已经在weka工作了几个月了。目前,我正在 Ostfold 大学学院学习我的机器学习课程。我需要一种更好的方法来构建基于分离的训练和测试集的决策树。任何想出好主意的人都可以得到很大的缓解。提前谢谢。
-新
r - 派对包中的ctree函数-如何以简单的方式获取拆分变量的列表
我试图在使用时获取树的拆分变量列表ctree
。
我找到了一种使用 psplit 获取特定节点的特定拆分变量的方法。但我想获得整个树中分裂变量的整个列表。
有什么简单的获取方法吗?
algorithm - 在模拟中优化决策的最佳算法
我正在寻找最佳算法来优化同时做出的决策,以便在合理的时间内找到快速的结果。simultaion 做了一些“滴答”,偶尔需要做出决定。最终达到目标状态。(如果您做出非常糟糕的决定,可能永远无法达到目标状态)
有许多许多目标状态。我想用最少的滴答声找到目标状态(一个滴答声大约相当于现实生活中的一秒。”我基本上想决定在尽可能短的时间内做出哪些决定来达到目标,
关于问题域的几点:
- 我可以立即产生一系列选择,这些选择将导致解决方案。它不会是最优的。
- 我有一个合理的启发式函数来确定什么是一个好的决定
- 我有一个合理的函数来确定从节点到目标的最小可能时间成本。
算法:
- 我需要处理这个问题大约 10 秒钟,然后给出我能给出的最佳答案。
- 我相信 A* 会为我找到最佳解决方案。问题是决策树太大了,我无法足够快地计算它。
- IDA* 会在 10 秒内给我很好的前几个选择,但我需要一条通向目标的路径。
目前我正在考虑从已知的非最佳目标路径开始,然后可能使用模拟退火并尝试在 10 秒内改进它。
什么是一个很好的算法来研究试图解决这类问题?
artificial-intelligence - 分类器算法的参数优化
据说不同的算法有不同的参数。我真的不认为这是真的,比如说如果它是一个树决策算法和朴素贝叶斯算法,每个的参数是什么?谁能给我一个例子。。
如果是这种情况,那么对将要使用决策树算法运行的数据进行 5 折交叉验证与贝叶斯算法不同吗?
同样对于参数优化,我将进行 5 折交叉验证。有没有办法自动执行此操作以使用 weka 确定参数的设置值键?
r - 使用 rpart 在回归树中搜索相应的节点
我对 R 很陌生,我遇到了一个非常愚蠢的问题。
我正在使用rpart包校准回归树,以便进行一些分类和一些预测。
多亏了 R,校准部分易于操作且易于控制。
在校准了一个大决策树之后,我希望为给定的数据样本找到一些新数据的相应集群(以及预测值)。
该predict
功能似乎非常适合需要。
但是,使用该predict
方法,我只能获得新元素的预测比率,并且找不到获取新元素所属的决策树叶的方法。
我认为它应该很容易得到,因为 predict 方法必须找到那个叶子才能返回比率。
有几个参数可以通过class=
参数传递给 predict 方法,但是对于回归树来说似乎都返回相同的东西(决策树的目标属性的值)
有谁知道如何获取决策树中的相应节点?
通过使用该path.rpart
方法分析节点,这将有助于我理解结果。
java - 检查列表的所有元素(Drools Expert)
我正在尝试在 Drools Expert 中编写规则。在when
规则部分,我检查了Application
对象的一些属性。该对象包含一个列表,我想检查一堆规则是否适用于该列表中 SomeOtherType 的所有对象。仅当约束对该列表中的所有对象都有效时,该规则才应触发。
machine-learning - 自动法律问答系统
我正在尝试实现一个 Web 应用程序,该应用程序将允许用户定义规则并根据一组规则提出问题以查看语句是合法的还是非法的。我想到的领域是小型社区或俱乐部的规则。
例如,假设一个可能的规则集包含以下规则:
然后有人问"Can I park my Honda here?"
系统将尝试通过首先遵循类似于以下的问答树来回答:
用户在每个节点选择一个答案,系统会根据一个答案提出下一个问题,直到到达一个叶子节点,代表一个“最终”的答案。
在每个节点,用户可以要求系统解释或定义问题中使用的术语。解释将是一系列包含术语的陈述,这些术语本身可以进一步解释或定义。
在获得足够的经验后,系统可以自动跳过某些节点,例如第一个“本田是汽车吗?” 当它了解到在“停车”的上下文中,“本田”总是意味着“汽车”。
尽管此树中未显示,但某些树可能具有“未定义”叶节点,表示规则没有提供足够覆盖范围以完全创建树的情况,需要将问题重定向给人类专家以澄清或更正规则。
目标是在数据库中定义规则,然后根据需要动态生成这些问答树。
尽管此处显示的规则和问题表示为自然语言,但初始系统将使用符号逻辑代替,因为除了这种逻辑解析之外进行 NLP 会使初始系统变得非常复杂。这些规则最初可能是作为自然语言起草的,但在输入系统之前,它们会被手动转换为离散规则。问题将显示为简单的自然语言陈述,答案将是多项选择。
这看起来像是一个实用的项目吗?有没有先有技术?到目前为止,我还没有阅读过类似的内容,但我不确定哪些搜索关键字能够充分描述这个系统。
我应该使用什么工具?我不确定是否应该使用决策树或某种专家系统来将问题与规则匹配并缩小问题的范围。