问题标签 [random-forest]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R随机森林变量重要性
我正在尝试使用随机森林包在 R 中进行分类。
列出的变量重要性度量是:
- 第 0 类变量 x 的平均原始重要性得分
- 第 1 类变量 x 的平均原始重要性得分
MeanDecreaseAccuracy
MeanDecreaseGini
现在我知道这些“意味着”是什么,就像我知道它们的定义一样。我想知道的是如何使用它们。
我真正想知道的是,这些值仅在它们的准确程度、什么是好值、什么是坏值、最大值和最小值等方面意味着什么。
如果一个变量有一个高值,MeanDecreaseAccuracy
或者MeanDecreaseGini
这意味着它是重要的还是不重要的?此外,有关原始分数的任何信息也可能很有用。我想知道与这些数字的应用相关的所有信息。
使用“错误”、“求和”或“置换”等词的解释比不涉及任何讨论随机森林如何工作的更简单的解释更有帮助。
就像我希望有人向我解释如何使用收音机一样,我不希望解释涉及收音机如何将无线电波转换为声音。
r - 如何使用 R 随机森林来减少没有离散类的属性?
我想使用随机森林来减少属性。我在数据中遇到的一个问题是我没有离散类 - 只有连续类,这表明示例与“正常”有何不同。这个类属性是一种从零到无穷大的距离。有没有办法将随机森林用于此类数据?
machine-learning - 决策树学习和杂质
杂质的测定方法有以下三种:
每种方法有什么区别和合适的用例?
matlab - 随机森林代码审查
我正在做一个关于随机森林算法的研究项目。我发现了该算法的许多实现,但代码的主要部分通常是用 Fortran 编写的,而我完全不了解它。
我必须编辑代码,更改主要参数(如树深度、特征变量的数量……)并在每次运行期间跟踪算法的性能。
目前我正在使用“ Windows-Precompiled-RF_MexStandalone-v0.02- ”。train 和 predict 函数是 matlab mex 文件,不能打开或编辑。任何人都可以给我一条关于该做什么的建议,或者是否有一个有效且完全基于 matlab 的随机森林版本。
我已经仔细阅读了 randomforest-matlab。不幸的是,主要的培训部分是一个 dll 文件。通过阅读更多,我的大部分奇迹现在都解决了。我的问题主要是如何同时运行几棵树。
c++ - OpenCV - 随机森林示例
有没有人有一些使用带有 2.3.1 API Mat 而不是 cvMat 的随机森林的例子?
基本上我有一个矩阵垫数据,它由 1000 行和 16x16x3 元素组成,矩阵垫响应一个 1000x1 矩阵,其中包含每行所属的类。我想对此运行随机森林算法。
r - R将多个randomForest对象放入一个向量中
我很好奇R是否能够将对象放入向量/列表/数组/等中。我正在使用 randomforest 包来处理较大数据的子集,并希望将每个版本存储在列表中。这将类似于:
理想情况下,我想做这样的事情:
这种工作,但这是单个 RF 对象的输出:
虽然这是“答案”列表的输出:
有谁知道如何存储所有 RF 对象或调用它们以便存储的信息与单个 RF 对象相同?感谢您的建议。
r - 加速随机森林的建议
我正在使用该randomForest
软件包进行一些工作,虽然它运行良好,但它可能很耗时。有人对加快速度有什么建议吗?我正在使用带有双核 AMD 芯片的 Windows 7 机器。我知道 R 不是多线程/处理器,但很好奇是否有任何并行包(、、、rmpi
等snow
)snowfall
适用于某些randomForest
东西。谢谢。
编辑:
我正在使用 rF 进行一些分类工作(0 和 1)。数据有大约 8-12 个变量列,训练集是 10k 行的样本,所以它的大小合适但并不疯狂。我正在运行 500 棵树,mtry 为 2、3 或 4。
编辑2:这是一些输出:
r - 如何使用 foreach 和 doMC 包为随机模拟设置种子?
我需要做一些模拟,出于调试目的,我想用它set.seed
来获得相同的结果。这是我正在尝试做的示例:
对象a
和b
应该相同,即sum(abs(a-b))
应该为零,但事实并非如此。我做错了什么,或者我偶然发现了一些功能?
我能够使用 R 2.13 和 R 2.14 在两个不同的系统上重现它
r - 如何在 R 中使用缺失值的随机森林?
我想拟合一个随机森林模型,但我收到了这个错误:
我的数据框学习了 16 个数字属性,WIN 是一个级别为 0 1 的因素。
r - R rfcv 无法拆分数据
我正在尝试使用包rfcv
中的功能randomForest
。我收到如下错误消息:
有什么不对劲吗?我尝试缩小数据,以便唯一值可以被 5 整除,但仍然得到相同的消息。我也尝试了各种cv.fold=
没有效果的值。