问题标签 [r-caret]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1691 浏览

r - 插入符号的预测区间

我一直在使用 R 中的 caret 包来运行一些增强的回归树和随机森林模型,并希望使用内置的交叉验证例程为一组新案例生成预测区间。

trainControl 函数允许您保存每个 n 折叠处的保留预测,但我想知道是否也可以使用内置函数在每个折叠处预测未知情况,或者我是否需要使用单独的循环构建模型 n 次。

非常感谢任何建议

0 投票
2 回答
3094 浏览

r - 在插入符号中拟合无截距模型

在 R 中,我指定了一个没有截距的模型,如下所示:

但是,如果我用插入符号拟合相同的模型,则生成的模型将包含一个截距:

我如何告诉caret::train排除截距项?

0 投票
1 回答
924 浏览

r - 在插入符号中访问 rfe 生成的所有模型

我正在使用rfecaret 包中的函数为逻辑回归模型进行特征选择。我正在查看sizes5、10、15、20 和 25 选择使用 Rsquared 的最佳模型(我的因变量是 0,1)。rfe除了最终选择的模型之外,有没有办法访问该函数产生的其他模型?

0 投票
3 回答
21574 浏览

r - 使用插入符号的完全可重现的并行模型

当我在插入符号中运行 2 个随机森林时,如果我设置一个随机种子,我会得到完全相同的结果:

但是,如果我注册一个并行后端来加速建模,每次运行模型时都会得到不同的结果:

有没有办法解决这个问题?一个建议是使用doRNG包,但train使用当前不支持的嵌套循环:

doSNOW更新:我认为可以使用and来解决这个问题clusterSetupRNG,但我无法做到。

foreach有什么特别之处,为什么不用我在集群上发起的种子?对象ab是相同的,那么为什么不model1model2

0 投票
2 回答
13304 浏览

r - 当其中一些是因素时,如何预处理特征?

我的问题与使用 Caret 包 的分类数据(R 术语中的因素)有关。我从链接的帖子中了解到,如果您使用“公式界面”,则某些功能可能是因素,并且培训会正常工作。我的问题是如何使用preProcess()函数缩放数据?如果我尝试在以某些列为因素的数据框上执行此操作,则会收到以下错误消息:

请参阅此处的一些示例代码:

谢谢你。

0 投票
1 回答
1657 浏览

r - R caret / rfe / bayesglm 特征选择

我正在使用bayesglm逻辑回归问题。这是一个包含 150 行和 2000 个变量的数据集。我正在尝试进行变量选择,通常会查看glmnet. caret::rfe但是没有方法bayesglm

无论如何要手动定义一个方法rfe吗?

0 投票
1 回答
3521 浏览

r - R caret / rfe 内训练的交叉验证如何工作

我对图书馆的rfe功能有疑问。caret在插入符号主页链接上,他们给出了以下 RFE 算法: 算法

在这个例子中,我使用了rfe带有 3 折交叉验证的函数和带有线性支持向量机和 5 折交叉验证的train函数。

  • 从上面的算法中,我假设该算法可以使用 2 个嵌套的交叉验证:
    1. rfe将数据(150 个样本)分成 3 折
    2. train函数将在具有 5 倍交叉验证的训练集(100 个样本)上运行以调整模型参数 - 以及随后的 RFE。

让我困惑的是,当我查看rfe函数的结果时:

由此看来,来自 5 倍 cv 的训练集的大小是 120 个样本,而我预计的大小是 80。

因此,如果有人能阐明rfetrain如何协同工作,那就太好了。

干杯

0 投票
3 回答
36427 浏览

r - 在 R 中保存和加载模型

使用caret时,如何在训练后保存模型,并稍后加载(例如在不同的会话中)以进行预测?

0 投票
1 回答
1553 浏览

r - 带有插入符号的多个模型的预测统计

我正在尝试使用包caret获取各种训练模型的预测统计信息。下面是一个说明我需要的例子:

如何从 X_kand Y_pred为我的 4 个模型获取预测统计信息(ROC 等)?

0 投票
2 回答
4128 浏览

r - 插入符号和 GBM 错误

我正在尝试将caretR 中的包用于具有用户定义的性能指标的几个嵌套交叉验证过程。我遇到了各种各样的问题,所以我回过头来看看是否存在更多开箱即用的问题caret,似乎我遇到了一个问题。

如果我运行以下命令:

我收到错误(或类似错误):

{ 中的错误:任务 1 失败 - “参数暗示不同的行数:619、381”

带有警告:

但是,如果我只运行 gbm 例程,一切都会很好。