问题标签 [r-caret]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5910 浏览

r - 多核中的 R caret nnet 包

我们可以通过利用 foreach 包、nnet 和 caret 包使用多核并行训练神经网络模型吗?

我只看到并行的随机森林实现。神经网络可以吗?

我对插入符号的 train 函数特别感兴趣,它可以对最佳隐藏层和衰减大小进行网格搜索。这需要很长时间才能在单核上运行。

任何帮助表示赞赏。

0 投票
1 回答
87 浏览

r - 我想知道如何在 CARET 包中更改或选择 AVNNET 中的传递函数?

我想知道如何在 CARET 包的 AVNNET 中更改或选择传输函数,例如 logig 或 tansig?

0 投票
1 回答
312 浏览

r - 插入符号:开关错误(tolower(trControl$method),oob = NULL,alt_cv = ,cv = createFolds(y,

我正在使用caret包来调整模型alphalambda参数glmnet。我的特征在X(数据框,14474 个变量中的 47 个 obs,一个 p>>N 问题),因变量y是一个 47 个 obs 的数据框。1 个变量。

当我尝试

我明白了

我试过转置y,也改成class(y) = "numeric",而不是,"data.frame"但我得到了同样的错误,我不明白。有什么线索吗?

0 投票
3 回答
7078 浏览

r - 使用 e1071 和插入符号的 SVM 模型的结果截然不同

我正在对我的数据使用两个不同的包来训练两个 SVM 模型,并得到截然不同的结果。这是可以预料的吗?

使用 e1071 的模型 1

使用插入符号的模型2

calculateAUC()是我定义的一个函数,用于计算 AUC 值,给定目标的预测值和实际值。我将这些值视为:

型号 1 (e1071)

1
0.8567979

模型2(插入符号)

0.9910193
0.758201

这是可能的吗?还是我做错了?

如果有帮助,我可以提供示例数据

0 投票
1 回答
3865 浏览

r - enet() 有效,但通过 caret::train() 运行时无效

我正在尝试运行弹性网络。从 LASSO 开始,然后从那里开始。我可以让它直接运行,但是当我尝试traincaret包中运行相同的参数时它会失败。我想开始train工作,以便可以使用它来评估模型参数。

请注意,上述示例中的任何共线性只是对可重现示例进行子集化的结果(1,000 行与真实数据集中的 208,000 行)。

我以各种方式检查了完整的数据集,包括findLinearCombos. 请注意,有几百个变量是从临床诊断中虚拟出来的,因此是二进制的,只有低比例的 1。

我如何获得train(...,method="enet") to run using the exact same settings asenet()`?

再现性、会话信息等数据。

示例数据xy在此处获得

结果sessionInfo()

更新

在数据集的 15% 样本上运行:

X 矩阵有 806 列,其中 801 列是虚拟的。其中许多假人非常稀疏(大约 25k 行中的 1-3 个观察值),其他人的值的 0.1-5% 为 TRUE。总共有 108867 个 TRUE 和 21mm FALSE。

0 投票
1 回答
3607 浏览

r - 使用 caret 包中的 SVM 和 rfe 进行多类特征选择

我正在尝试使用包中的rfe函数caret对属于大约 50 个不同类的 400 个变量运行特征选择,总共有 8000 个样本。如果我将我的数据子集为大约 5 个类和 10 个变量,那么一切正常。但是,当我包含整个数据集时,R 运行了大约 32 小时,然后我收到警告说R GUI has stopped working. 我尝试将我的数据子集为 100 个变量和 1000 个样本,同样的事情发生了。我尝试使用完全不同的 44 个变量数据集和属于 44 个类的大约 3000 个样本。然而,大约一天后,R 变得无响应并关闭。iris为了重现性,我在数据集上尝试了相同的代码:

我正在运行 Windows 7,因此无法使用推荐的doMC软件包。我在具有 32G RAM 的机器上使用了最新的 64 位 R 版本。仍然没有成功。有什么我在这里俯瞰的吗?

0 投票
1 回答
3166 浏览

r - caret::train:指定训练数据参数

我正在设计一个神经网络模型,该模型使用有限的更多扩展输入数据(如纹理、体积密度和一两个保水性)来预测 van genuchten 保水参数(theta_r、thera_s、alpha、n)的估计。在研究 R 项目中的神经网络时,我发现了 RSNNS 包,我创建并训练了多个多层感知器 (MLP),并调整了隐藏单元的数量和学习率。这些模型的训练和测试 RMSE 的一般性能非常差且随机,事实上,我使用 alpha 和 n 参数的对数转换值来避免偏差并考虑它们近似对数正态分布,但这并没有多大帮助:( . 我被推荐使用 nnet 和 caret 包,但我在调整代码时遇到了麻烦,我不知道我做错了什么,

0 投票
1 回答
1389 浏览

r - rpart 模型在插入符号中折叠为零分裂

我正在使用 rpart 在 caret 包中运行回归树分析,使用 oneSE 选项进行选择功能。当我这样做时,我经常会得到一个零分裂的模型。它表明没有模型会比任何模型更好。这应该发生吗?

这是一个例子:

这是模型输出:

这是 printcp 的输出:

但是,如果我直接在 rpart 中运行模型,我可以看到更大的、未修剪的树,它被修剪为上面所谓的更简约的模型:

Caret [我认为] 试图找到最小的树,其 RMSE 在具有最低 RMSE 的模型的 1 SD 范围内。这类似于 Venebles 和 Ripley 提倡的 1-SE 方法。在这种情况下,即使没有解释力,选择没有拆分的模型似乎也会陷入困境。

这是正确的吗?这个可以吗?似乎应该有一条规则来防止选择没有拆分的模型。

0 投票
1 回答
4055 浏览

r - 插入符号中 KNN 的自定义参数调整

我有 ak 最近邻实现,它让我可以在单遍预测中计算多个 k 值以及训练和测试数据的多个子集(例如,K 折交叉验证中的所有折叠,AKA 重采样指标)。我的实现还可以利用多个内核。

我想将我的方法与 caret 包一起使用。我可以轻松地为 train 函数构建自定义方法。但这将导致对模型拟合的多次调用(每个参数和折叠组合调用一次)。

据我所知,我无法在使用 trainControl 时指明调优策略。train 的代码源提到了一些关于“seq”模型拟合的内容:

但是我看不到任何方法可以将其与自定义模型一起实际使用。

关于如何解决这个问题的任何线索?

更一般地说,假设您有一个模型类,您可以在其中使用单个模型拟合来估计多个参数的预测误差(例如,线性回归 LOOCV 技巧,但也适用于多个参数值),您将如何在插入符号中连接它?

以下是在插入符号中设置(空)自定义模型的一些示例代码:

我想控制训练过程,以便在一次调用中生成所有折叠和参数值的预测。

0 投票
3 回答
30608 浏览

r - R包插入符号混淆矩阵缺少类别

我正在使用RconfusionMatrix中的函数来计算我拥有的一些数据的一些统计数据。我一直在将我的预测以及我的实际值放入函数中,以获取要在函数中使用的表,如下所示:carettableconfusionMatrix

然而,有多种可能的结果(例如 A、B、C、D),我的预测并不总是代表所有的可能性(例如只有 A、B、D)。函数的结果输出table不包括缺失的结果,如下所示:

confusionMatrix函数无法处理丢失的结果并给出错误:

有没有办法我可以table不同地使用该函数来获取带有零的缺失行,或者以confusionMatrix不同的方式使用该函数,以便它将缺失的结果视为零?

注意:由于我是随机选择要测试的数据,因此有时一个类别也没有在实际结果中表示,而不仅仅是预测结果。我不相信这会改变解决方案。