问题标签 [r-caret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用方法 gam 从 caret 包中训练错误:
我有一个gam
模型,我知道它在 中工作得很好R
,但是当我尝试“ train
”使用包的相同模型时,caret
它返回一个错误,指出输入数据列是列表。有人明白这个吗?
我正在运行的代码如下:
第一个 gam 模型工作正常,但 train 返回以下错误:
直接在公式上运行 model.frame.default 也会产生这个错误,所以这个问题严格来说不在于 train。
mydata 如下所示:
有关信息,我的 R 安装如下:
感谢您的帮助!
r - Caret::train - 未估算的值
我试图通过将“knnImpute”传递给 Caret 的 train() 方法的 preProcess 参数来估算值。根据以下示例,这些值似乎没有被估算,保持为 NA 然后被忽略。我究竟做错了什么?
任何帮助深表感谢。
更新:我已经能够直接使用 preProcess 函数来估算值。我仍然不明白为什么在火车功能中似乎没有发生这种情况。
r - R doMPI 安装不起作用 - 需要从源代码构建?
我正在尝试在 R 中安装 doMPI 包。显然没有可用于 3.x 版本的二进制文件?我需要从源代码构建它吗?
http://cran.r-project.org/web/packages/doMPI/ <>
目标是在 Windows 机器上使用插入符号运行并行处理。
r - Caret - 一些预处理选项在 Train 中不可用
在 caret::train 中,有许多预处理选项可以通过 'preProcessing' 参数传递。这让生活变得超级简单,因为测试数据会在调用“predict.train”时以与训练数据相同的方式自动进行预处理。是否可以以某种方式对“findCorrelation”和“nearZeroVar”做同样的事情?
我从文档中清楚地理解了为什么以下代码不起作用,但我希望这能澄清我的问题。理想情况下,我可以执行以下操作。
r - 使用 caret 包运行带有 controls = cforest_unbiased() 的 cforest
我想使用 caret 包运行一个公正的 cforest。这可能吗?
错误是Error in as.character.default(<S4 object of class "ForestControl">) :
no method for coercing this S4 class to a vector
这是因为 cforest_control() 无法强制转换为数据框。如果我使用,该功能确实有效:
但是,如果我想更改 ntree,这没有效果:
这不会像 randomForest 那样出错。
r - 使用 RMSE 的插入符号二进制分类
有没有办法让插入符号将 RMSE 用于二进制分类问题?
如果您尝试使用metric = "RMSE"
分类问题,您将收到以下消息:
这是有道理的。但是有没有办法定义自定义指标?例如,如果您的结果是0
或1
,您可以将误差定义为模型预测的概率outcome - p
在哪里。p
编辑 =====================
为了给出一些背景信息和想要使用这个度量的一些原因,请参阅Michael J. Procopio的An Experimental Analysis of Classifier Ensembles for Learning Drifting Concepts Over Time in Autonomous Outdoor Robot Navigation 中的 2.7.1,或关于 softclassval 的论文
r - 在 R 中使用插入符号进行交叉验证的 SVM
有人告诉我使用 caret 包,以便对我拥有的数据集执行支持向量机回归,并进行 10 倍交叉验证。我正在根据 151 个变量绘制我的响应变量。我做了以下事情: -
我得到了
但我希望能够查看我的褶皱,以及每个褶皱的预测值与实际值的接近程度。我该如何看待这个?
此外,它说: -
我只是想知道这意味着什么以及上表中的 C 代表什么?
这是我的数据集的片段。我正在尝试针对 151 个变量设置 RT 秒数。
谢谢
r - 如何在 R 中的插入符号序列中查看模型中的奇点
我有一个 161 x 151 的数据库,我在我的数据集上应用了以下内容:-
我得到回报
我知道这意味着我的很多变量是共线性的,因此不是自变量。所以我希望能够查看我的数据的系数矩阵,所以我做了:-
但是您可以想象的结果太大了,无法将其全部放入我的 R 屏幕中。有没有一种查看模型矩阵的方法,这样我就可以看到哪些变量彼此共线,此外,如果我的变量是共线的,从这里开始我可以做些什么来更好地改进模型?我该如何克服呢?
谢谢
r - 如何在 R 中查看更多数据
这可能是一个愚蠢的问题,但我对我的数据执行了 SVM,模型的最佳拟合出现在 C = 0.5 时,因为它给出了最佳 RMSE 值。这是伟大的。我通过执行以下操作对其进行了 10 次交叉验证,十次:-
我希望能够查看我所有预测值和观察值的值,就像你在执行函数时得到的那样:-
但它会打印出所有不同的 C 值(其中三个)的所有折叠和重复,这并不完全适合 R 的屏幕。
有没有办法我可以修改该函数,使其仅在 C 等于 0.5 时打印出 10 次重复中每个折叠的预测结果?
所以是这样的: -
但仅适用于 .C 为 0.5 时,因为目前它正在打印 .C 也是 0.25 和 1 时
谢谢
pca - 如何在执行主成分回归后提取成分以在 R 插入符号包中进行进一步分析
我有一个包含 151 个变量的数据集,这些变量被发现具有很高的共线性,因此我通过执行以下操作对其进行了主成分回归:-
这给了我:- RMSE = 65.7 R 平方 0.443
我只是想知道之后我是如何提取这些组件的,以便我可以说应用进一步分析(即对其执行 SVM,或随机森林)