问题标签 [mlr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
263 浏览

r - R - MLR - randomForestSRC - 模型规模巨大,预测时间非常慢 - 如何减少两者?

使用 MLR训练了分类 randomForestSRC ( https://www.rdocumentation.org/packages/randomForestSRC/versions/2.6.0 ),模型大小为许多 GB,每个实例的预测时间非常慢。

我们可以从模型中去除什么来减小尺寸,并且可能也减少预测时间?

请注意,一些测试表明预测 100 个项目的速度与预测 1 基本相同。

https://kogalur.github.io/randomForestSRC/theory.html

0 投票
1 回答
46 浏览

r - 为 mlr 包中的特征选择传递数据类型参数

我刚刚开始尝试mlr包,我喜欢训练模型的易用性以及它可以做的所有其他事情。

但是,我被困在feature selection这段代码的最后一部分。我打算做的是应用variance方法generateFilterValuesData(),我知道方差只能应用于数值,因此我试图探索是否有一个inbuilt parameter可以允许数据按数据类型进行子集化,然后函数可以应用于下面的任务。

0 投票
0 回答
58 浏览

r - R-mlr: How to pass extra parameters to predict while using resampling?

Is there a way to pass parameters to the predict call when using resampling in mlr? E.g. predict.coxph has an extra parameter "reference", which i want to change when using resampling, but extra-parameters for resampling seem to be for the learner only.

I have for now just extracted the models and the test data from the resampling object and apply the prediction myself, but that seems clumsy somehow.

Is there a better solution? Thanks!

0 投票
1 回答
120 浏览

r - MLR 和 randomForestSRC:计算机之间的不连贯性

我们的团队运行以下代码来创建随机森林模型并对其进行训练:

大多数情况下,该模型预测了有意义的连贯结果。然而,当我在我的两个同事的计算机上运行完全相同的代码(没有任何变化)时,该模型预测了这些奇怪的结果:

仅在两台计算机上而在其他计算机上没有这种奇怪行为的原因可能是什么?

0 投票
1 回答
1100 浏览

r - 如何在 R Markdown 中水平绘制决策树?

在 R Markdown 中,我想水平绘制决策树,以便它更适合整个 PDF 页面。此代码垂直绘制它:

我怎样才能将它水平绘制呢?

0 投票
1 回答
36 浏览

mlr - 找不到函数“generateFunctionalANOVAData”

使用 mlr 2.12.1 进行交互分析

只需在http://mlr-org.github.io/exploring-learner-predictions-with-partial-dependence/上运行示例代码

但返回错误如下:

有错误

毫升版本:

0 投票
1 回答
319 浏览

r - 集成分类器的性能会不如最好的单一分类器吗?

我最近在多中心数据集的 MLR (R) 中运行了一个集成分类器。我注意到三个分类器(在不同数据模态上训练)的集成比最好的分类器差。这似乎出乎我的意料。我使用逻辑回归(没有任何参数优化)作为简单分类器,使用偏最小二乘 (PLS) 判别分析作为超级学习器,因为基础学习器的预测应该是相关的。我还测试了不同的超级学习者,比如 NB 和逻辑回归。结果没有改变。

以下是我的具体问题:

1)你知道,这原则上是否会发生?(我也google了一下,发现这个博客似乎表明它可以: https ://blogs.sas.com/content/sgf/2017/03/10/are-ensemble-classifiers-always-better-than-单分类器/ )

2) 特别是,如果您像我一样感到惊讶,您是否知道我可以在 mlr 中进行的任何检查以确保没有错误。我尝试过使用不同的交叉验证方案(最初我使用了 leave-center-out CV,但由于一些中心提供的数据很少,我不确定这是否会导致超级学习者的奇怪模型拟合),但是它仍然成立。我还尝试结合不同的数据模式,它们给了我同样的现象。

我很高兴听到您是否经历过这种情况,如果没有,您是否知道问题可能是什么。

提前致谢!

0 投票
2 回答
1338 浏览

r - 使用 mlr 的嵌套重采样 + LASSO (regr.cvglment)

我正在尝试使用 regr.cvglment 进行嵌套重采样,其中 10 个 CV 用于内部循环,10 个 CV 用于外部循环。Mlr 使用包装函数 ( https://mlr-org.github.io/mlr/articles/tutorial/devel/nested_resampling.html )提供代码

现在,我只是从他们提供的代码中交换了两件事 1)“regr.cvglmnet”而不是支持向量机(ksvm) 2)内循环和外循环的迭代次数

在 lrn 函数之后,我得到下面指定的错误。有人可以向我解释一下吗?我对编码和机器学习完全陌生,所以我可能在代码中做了一些非常愚蠢的事情......

0 投票
1 回答
424 浏览

r - 如何预测 cox 回归的 brier 分数?

我正在使用mlr包在 R 中进行机器学习。我在数据集上使用cvcoxboost算法,并希望计算输出的 brier 分数。

这应该有效,因为listMeasures(cvcoxboost.tsk)还列出了 measure ibrier。整个代码如下所示:

...我收到错误No method for evaluating predicted probabilities from objects in class: CoxBoost

0 投票
2 回答
850 浏览

random-forest - 使用 MLR 包进行超参数调整

我想使用 MLR 包调整随机森林的超参数。我有几个问题:

1)我如何决定我应该调整哪些参数?我听说过保持 num.trees 在计算上尽可能高并调整 mtry?(虽然我在网上找不到任何支持这一点的东西)

2) 我的调整 mtry 范围应该是多少?这里是参数的 0 到 1/3 之间的一个好的经验法则吗?如果是这样,如果我有不同的数据集(即,我会写什么而不是 lower=0 和 upper =10),我将如何将其集成到下面的代码中?

3)最后,两次创建学习器是否有意义,一次使用 makeLearner 函数,我在 par.vals 中设置参数,然后一次使用 makeTuneWrapper 函数?无论如何它不会覆盖它吗?