问题标签 [c4.5]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

29 问题

0 投票

0 回答

166 浏览

r - 在 R 中实现 C4.5 的集成

我正在寻找一个“投票”分类器，它是通过将训练集拆分为 k 个片段、分别在每个片段上构建 C4.5 树并使用树的多数投票作为输出而获得的。

我必须选择什么型号？（Bagging CART/ Boosted C5.0/ Random Forest 或 Gradient Boosted Machine）以下模型是否适合我的需要，其中试验次数等于 k：

或者我是否必须进行任何更改以满足我的投票需求并将数据库拆分为 k 个片段？我该如何实施？

r c4.5

2015-09-18T14:17:04.710

0 投票

1 回答

4264 浏览

r - 如何在数据集上使用 RWeka 包？

所以我在网上生成了一个随机数据集，我需要在上面应用 C4.5 算法。
我安装了 RWeka 包及其所有依赖项，但我不知道如何执行它。
有人可以帮我提供教程的链接吗？除了 RWeka 文档之外的任何内容。还是 R 中的示例 C4.5 代码以了解其工作原理？
谢谢

r id3 rweka c4.5

2015-11-12T13:34:51.760

0 投票

0 回答

361 浏览

algorithm - C4.5 算法中的数值

阈值 Z：

– 训练样本首先根据所考虑的属性 Y 的值进行排序。这些值的数量是有限的，所以让我们按排序顺序将它们表示为 {v1, v2, ..., vm}。– 任何介于 vi 和 vi+1 之间的阈值将具有相同的效果，将案例划分为属性 Y 的值在 {v1, v2, ..., vi} 的情况和值在 {vi+1, vi+ 的情况2, …, vm}。因此在 Y 上只有 m-1 个可能的分裂，所有这些都应该系统地检查以获得最佳分裂。

通常选择每个区间的中点：(vi+vi+1)/2 作为代表阈值。–C4.5 为每个区间 {vi, vi+1} 选择一个较小的值 vi 作为阈值，而不是中点本身

我只是想知道这是否正确。

可以说我有：

我必须进行 m-1 计算才能找到最佳值，所以

对于每个拆分（例如 65 和 >= 65 、<70 和 >=70 等等）。我必须计算
增益比，并选择给我更高增益的分割。我对吗？

algorithm decision-tree c4.5

2015-11-26T17:00:38.857

0 投票

1 回答

2468 浏览