问题标签 [r-caret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 插入符号的预测区间
我一直在使用 R 中的 caret 包来运行一些增强的回归树和随机森林模型,并希望使用内置的交叉验证例程为一组新案例生成预测区间。
trainControl 函数允许您保存每个 n 折叠处的保留预测,但我想知道是否也可以使用内置函数在每个折叠处预测未知情况,或者我是否需要使用单独的循环构建模型 n 次。
非常感谢任何建议
r - 在插入符号中拟合无截距模型
在 R 中,我指定了一个没有截距的模型,如下所示:
但是,如果我用插入符号拟合相同的模型,则生成的模型将包含一个截距:
我如何告诉caret::train
排除截距项?
r - 在插入符号中访问 rfe 生成的所有模型
我正在使用rfe
caret 包中的函数为逻辑回归模型进行特征选择。我正在查看sizes
5、10、15、20 和 25 选择使用 Rsquared 的最佳模型(我的因变量是 0,1)。rfe
除了最终选择的模型之外,有没有办法访问该函数产生的其他模型?
r - 使用插入符号的完全可重现的并行模型
当我在插入符号中运行 2 个随机森林时,如果我设置一个随机种子,我会得到完全相同的结果:
但是,如果我注册一个并行后端来加速建模,每次运行模型时都会得到不同的结果:
有没有办法解决这个问题?一个建议是使用doRNG包,但train
使用当前不支持的嵌套循环:
doSNOW
更新:我认为可以使用and来解决这个问题clusterSetupRNG
,但我无法做到。
foreach有什么特别之处,为什么不用我在集群上发起的种子?对象a
和b
是相同的,那么为什么不model1
和model2
?
r - 当其中一些是因素时,如何预处理特征?
我的问题与使用 Caret 包时 的分类数据(R 术语中的因素)有关。我从链接的帖子中了解到,如果您使用“公式界面”,则某些功能可能是因素,并且培训会正常工作。我的问题是如何使用preProcess()
函数缩放数据?如果我尝试在以某些列为因素的数据框上执行此操作,则会收到以下错误消息:
请参阅此处的一些示例代码:
谢谢你。
r - R caret / rfe / bayesglm 特征选择
我正在使用bayesglm
逻辑回归问题。这是一个包含 150 行和 2000 个变量的数据集。我正在尝试进行变量选择,通常会查看glmnet
. caret::rfe
但是没有方法bayesglm
。
无论如何要手动定义一个方法rfe
吗?
r - R caret / rfe 内训练的交叉验证如何工作
我对图书馆的rfe
功能有疑问。caret
在插入符号主页链接上,他们给出了以下 RFE 算法:
算法
在这个例子中,我使用了rfe
带有 3 折交叉验证的函数和带有线性支持向量机和 5 折交叉验证的train函数。
- 从上面的算法中,我假设该算法可以使用 2 个嵌套的交叉验证:
rfe
将数据(150 个样本)分成 3 折- 该
train
函数将在具有 5 倍交叉验证的训练集(100 个样本)上运行以调整模型参数 - 以及随后的 RFE。
让我困惑的是,当我查看rfe
函数的结果时:
由此看来,来自 5 倍 cv 的训练集的大小是 120 个样本,而我预计的大小是 80。
因此,如果有人能阐明rfe和train如何协同工作,那就太好了。
干杯
r - 在 R 中保存和加载模型
使用caret时,如何在训练后保存模型,并稍后加载(例如在不同的会话中)以进行预测?
r - 带有插入符号的多个模型的预测统计
我正在尝试使用包caret获取各种训练模型的预测统计信息。下面是一个说明我需要的例子:
如何从 X_kand Y_pred
为我的 4 个模型获取预测统计信息(ROC 等)?
r - 插入符号和 GBM 错误
我正在尝试将caret
R 中的包用于具有用户定义的性能指标的几个嵌套交叉验证过程。我遇到了各种各样的问题,所以我回过头来看看是否存在更多开箱即用的问题caret
,似乎我遇到了一个问题。
如果我运行以下命令:
我收到错误(或类似错误):
{ 中的错误:任务 1 失败 - “参数暗示不同的行数:619、381”
带有警告:
但是,如果我只运行 gbm 例程,一切都会很好。