问题标签 [r-caret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 向插入符号中的“训练”函数添加新方法
我想使用插入符号在 RSNSS(斯图加特神经网络模拟器)中训练模型。不幸的是,看起来 RSNSS 还没有在 train 中实现。train 函数中似乎没有任何用于添加新方法的文档,我想知道是否有其他人自己尝试过。
rsnss 对象已经定义了 'train' 和 'predict' 方法,所以我认为这应该不会太难。
谢谢你。
/edit:插入符号现在包括来自 RSNSS 包的方法。
r - 为什么插入符号火车占用这么多内存?
当我只使用 训练时glm
,一切正常,我什至没有接近耗尽内存。但是当我运行时train(..., method='glm')
,我的内存不足。
这是因为train
为交叉验证的每次迭代(或任何 trControl 过程)存储了大量数据吗?我正在查看,trainControl
但找不到如何防止这种情况...任何提示?我只关心绩效总结,也许还有预测的反应。
(我知道这与存储参数调整网格搜索的每次迭代中的数据无关,因为我相信 glm 没有网格。)
r - 使用时间序列交叉验证模拟 createFolds
R 包 caret 提供了一个方便的函数createFolds,它返回用于交叉验证的训练集的索引列表:
我想创建一个类似的函数,除了我想返回要在时间序列交叉验证中使用的索引列表。我在 R 中找到了一些示例代码,但我想对事物进行更多概括和功能化。这是我最初想出的:
(Min 是拟合模型所需的最小观察次数)
这个函数现在工作得很好,但我想添加Rob Hyndman 讨论的 2 个函数:
- 窗口化:它不是将训练集向后延伸到第一次观察,而是向后延伸 n 次观察。
- 可变预测范围:每折向训练集添加 1 个索引,每折向训练集添加 k。
这是我实现窗口的方式:
我不知道如何实现可变预测范围,如下所示:例如,如果 k=3:
我正在寻找改进现有代码的方法,以及在每次折叠时向训练集添加可变增量的方法。
谢谢
r - 使用 glmnet 和 2 个类时,插入符号中的训练函数出错
以下代码块失败,我无法辨别。
出现以下错误:
如果我使用不同的模型,比如glm
它运行良好。如果我使用 3 个类TrainClasses <- iris[,5]
,它也可以正常工作。
2 个类是如何唯一导致 glmnet 方法失败的?
这是 Windows 上的 R 版本 2.14.0,插入符号版本 5.09-006。同样的错误发生在我的 mac 和 linux 上。
r - R caret 和 gbm 找不到 ntrees 输入
我正在尝试gbm
使用caret
R 中的包来训练一个。我最初收到以下错误,并认为这是由于缺少输入,所以我创建了gbmGrid
但仍然收到相同的错误消息。
有什么建议么?
r - 因子()和NA的R插入符号/ rfe变量选择
我有一个数据集,NAs
到处都是慷慨的。
此外,它还有需要的列factors()
。
我正在使用包中的rfe()
函数caret
来选择变量。
似乎使用的functions=
论点适用于具有 NAs 但不适用于因子变量的数据,而适用于因子变量但不适用于 NAs 的数据。 rfe()
lmFuncs
rfFuncs
有什么建议可以解决这个问题吗?
我试过model.matrix()
了,但似乎只会导致更多问题。
r - caret::train:指定模型生成参数
我正在使用caret
R 中的库进行模型生成。我想生成一个earth
(又名 MARS)模型,并且我想degree
为此模型生成指定参数。根据文档(第 11 页),该earth
方法支持此参数。
指定参数时收到以下错误消息:
指定参数时如何避免此错误degree
?
r - R编程,通过插入符号的随机森林
我是 R 的新手,我想使用 caret 包实现随机森林算法。
有什么有用的教程,一步一步来吗?
r - 插入符号中的并行处理不适用于 R 2.13.0
我正在使用 R 包插入符号,并行处理不起作用。如果我尝试从train
函数运行示例:
我收到以下错误:
我正在使用 MacBook Pro,2011 年初型号,配备 2.3GHz Intel Core i5 和 Mac OS X 10.6.8。
R会话信息:
R 版本 2.13.0 (2011-04-13) 平台:x86_64-apple-darwin9.8.0/x86_64 (64-bit)
附加的基础包:[1] stats graphics grDevices utils
datasets methods base其他附加软件包:[1] caret_5.13-20 cluster_1.14.2 reshape_0.8.4 plyr_1.7.1 lattice_0.19-33 mlbench_2.1-0
doMC_1.2.3 multicore_0.1-7 [9] foreach_1.3.2 codetools_0.2-8迭代器_1.0.5通过命名空间加载(未附加):[1] compiler_2.13.0 grid_2.13.0 rpart_3.1-51 tools_2.13.0
我能做些什么来解决这个问题吗?
r - 从插入符号模型中收集非折叠预测
我想使用插入符号模型中的非折叠预测来训练包含一些原始预测变量的第二阶段模型。我可以按如下方式收集超出预期的预测:
这很好,但它们的顺序错误:
我知道该train
对象返回一个用于训练每个折叠的索引的列表:
如何使用这些信息以out_of_fold
与原始数据集相同的顺序将观察结果放入对象中BostonHousing
?