问题标签 [r-ranger]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
498 浏览

r - 在随机森林 tidymodels r 中设置调整游侠的最大深度

我想调整随机森林的深度以避免过度拟合。我正在使用 tidymodels,这是我的模型代码。

它给了我一个错误:

我还尝试了 dials 文档中的 tree_depth = tune() ,这给出了同样的错误。

但是当我查看 ranger 文档时,它具有 max.depth 作为参数。想知道如何使用 tidymodels tune 调整深度。

谢谢

0 投票
2 回答
236 浏览

r - 如何在随机森林中获得相同的预测(概率和类别)

我正在用ranger包装和相同的种子安装两个模型。第一个预测类,第二个返回概率矩阵,我的目标是达到相同的结果,但我在 4 个寄存器上有所不同。有人知道解决方案。我正在使用每个班级的最大概率。切入点应该是什么?

我的预期输出

0 投票
1 回答
293 浏览

r - TuneRanger 中的重复 CV

我正在使用包“TuneRanger”来调整射频模型。它工作得很好,我得到了很好的结果,但我不确定它是否过度拟合了我的模型。我想为包正在调整模型的每个实例使用重复 CV,但我找不到方法。另外我想知道是否有人知道该软件包如何验证每次尝试的结果(训练测试、简历、重复简历?)我一直在阅读软件包的说明(https://cran.r-project.org /web/packages/tuneRanger/tuneRanger.pdf)但它什么也没说。

谢谢您的帮助。

0 投票
1 回答
450 浏览

r - 如何使用 Ranger 绘制 OOB 错误与树的数量?

我想通过绘制 OOB 误差与树数的关系来获得随机森林的最佳树数,并查看误差在哪一点达到稳定。但是,由于我的问题涉及文本挖掘,我的训练数据是稀疏矩阵类型,即在 dgCMatrix 中。这意味着我不能使用 randomForest 包来训练我的模型,因为 randomForest 不支持稀疏矩阵。相反,我必须使用 ranger 包,但 ranger 没有给出 OOB 错误与树数的关系。我尝试将我的稀疏矩阵转换为维度为 90,000 x 5,500 的数据帧以在 randomForest 中运行,但即使并行执行也需要很长时间,而且我没有这种计算能力。

所以我的问题是:

  1. 如何绘制 OOB 错误与使用 ranger 的树数?

  2. 将稀疏矩阵转换为数据框的其他方法是什么?到目前为止我已经尝试过

    train_matrix <- as.data.frame(as.matrix(train_dtm))

  3. 有哪些方法可以使用转换后的数据帧来减少 randomForest 的运行时间?

  4. 如果上述方法失败,是否有其他方法可以在不绘制 OOB 错误与树数的情况下确定最佳树数?

如果可能的话,将不胜感激。谢谢!

0 投票
1 回答
1018 浏览

r - 如何在 R 中为“游侠”设置数据。错误:列中缺少数据

代码:

错误:列中缺少数据

是否有数据需要采用的格式?如何克服这个错误?

0 投票
1 回答
128 浏览

r - Ranger 预测 R 中的维数不正确

评估游侠的问题。在两者中,无法对数据进行子集化(想要 rf.trnprob 的第一列)

错误:

维数不正确

错误:

所有参数必须具有相同的长度

0 投票
0 回答
375 浏览

tidymodels - 如何确定 Ranger 中哪些列名是非法的?

这是一个护林员电话:

和输出:

如何判断哪些列是非法的?

我尝试设置一个函数 foo() 来调试:

这个函数对我帮助不大,因为我不知道如何在正确的位置获得断点。

它是游侠版本 0.12.1。

0 投票
2 回答
542 浏览

r - 如何保存防风草模型拟合(来自游侠)?

我有一个欧洲防风草模型(来自游侠),大致来自这里

如何将其保存到磁盘以便以后加载?

我试过dput了,得到一个错误:

确实,该model_fit.R文件中有几个missing_arg调用,这似乎是某种标记丢失参数的方法。然而,这是一条支线。我不需要使用 dput,我只想能够保存和加载模型。

0 投票
0 回答
262 浏览

r - 为什么带有 ranger 引擎的 tidymodels 比 ranger 慢得多?

我首先看一下 tidymodels。我当前项目的替代方案是未整理的游侠。在测试运行中,使用 ranger 引擎的 tidymodels 分类随机森林在经典 iris 数据集上运行时比手持 ranger 慢得多(大约慢十倍)。这是为什么?

0 投票
1 回答
651 浏览

r - R 中 Ranger 的 SHAP 重要性

有一个二元分类问题:如何获得 Ranger 模型的变量的 Shap 贡献?

样本数据:

我已经尝试了几个库(DALEX、、、、),shapr但我没有得到任何解决方案。fastshapshapper

我希望得到像SHAPforxgboostxgboost 这样的结果:

  • 其输出shap.values是变量的形状贡献
  • shap.plot.summary