问题标签 [r-caret]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1987 问题

0 投票

1 回答

701 浏览

r - 插入符号包中的 createGrid 函数 - 它被删除了吗？

我caret在 R（版本 3.0.2）中使用包（版本 6.0-24）。该功能createGrid实际上已被删除？在caret5.17-7 版本中，该功能仍然存在。

r r-caret

2014-03-08T21:13:12.447

0 投票

1 回答

10513 浏览

r - R中CARET包中的createTimeSlices函数

我正在处理多元金融时间序列数据并且在使用该createTimeSlices函数时遇到问题。除了Max Kuhn使用的功能外，我找不到该功能的任何用途。任何人都可以帮助我了解该功能的用法吗？

r time-series r-caret

2014-03-11T19:20:27.767

0 投票

0 回答

102 浏览

r - R中的内存问题

我正在尝试用一个训练集训练一个 k-NN 模型，该训练集包括 350k 观察和 3 个特征（所有三个都是 40、50 和 100 个级别的分类）。我正在使用 caret 包中的 knnreg，因为我的目标向量是连续的。

我的机器很弱，有 4GB 的 RAM。我还尝试了具有相同数据集的其他算法，并且遇到了类似的错误。

当我运行预测函数时弹出错误，我并不感到惊讶。在示例中，我仅运行 1 个观察结果：

为什么在我运行预测函数（而不是 knnreg）时会弹出错误？
有没有办法解决这个问题？

r machine-learning knn r-caret

2014-03-18T20:37:20.193

0 投票

1 回答

2728 浏览

r - R中的k-NN回归问题

我正在尝试从包插入符号运行 knnreg。出于某种原因，此训练集有效：

虽然这个不起作用：

这是目标向量：

我得到的错误是在预测阶段：

虽然这是我的测试集：

我错过了什么？

编辑：将 V4 集标签切换为“1”、“2”……实际上可以解决问题。算法是否将我的特征视为数字特征，即使它们是因子？

r regression knn r-caret

2014-03-20T10:15:00.077

0 投票

1 回答

658 浏览

r - 无法在 R 中查看包的源代码

我正在尝试在插入符号中查看函数 knnreg 的源代码。

发生了什么？源代码在哪里？

r r-caret

2014-03-24T08:25:18.107

0 投票

1 回答

1512 浏览

r - 插入符号包的性能非常慢，具有多核

我正在阅读caret包作者的《应用预测建模》一书。

第一个 svm 训练示例需要几个小时才能在我的 64 位 i7 16 GB xubuntu 桌面上运行 [我在 4 小时后放弃了]。由于这是一个“玩具”数据集 [800 行，42 个变量]，因此肯定有一种方法可以在合理的时间内运行它。

问题：如果这段代码是正确的，它如何在合理的时间内运行？

r performance multicore r-caret

2014-03-27T12:08:47.360

0 投票

1 回答

2487 浏览

r - C50 通过插入符号包苦苦挣扎

我正在为 C50 包的插入符号火车包装而苦苦挣扎。我正在尝试拟合预测模型

和

我明白了

我的会话信息是

提前致谢

r r-caret

2014-04-05T15:49:42.590

0 投票

2 回答

49816 浏览

r - 使用 Caret 在 R 中为 k-fold CV 创建折叠

我正在尝试使用 http://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/上提供的数据为几种分类方法/超参数制作 k 折 CV声纳.所有数据。

该集合由 208 行组成，每行有 60 个属性。我正在使用 read.table 函数将它读入 data.frame 中。

下一步是将我的数据分成 k 折，假设 k = 5。我的第一次尝试是使用

我有两个问题。第一个是褶皱的长度不相邻：

另一个是这显然根据属性索引拆分了我的数据，但我想拆分数据本身。我认为通过转置我的data.frame，使用：

但是当我调用 createFolds 函数时，它给了我这样的信息：

长度问题已解决，但它仍然没有相应地拆分我的 208 数据。

我可以做什么？插入符号包可能不是最合适的吗？

r cross-validation r-caret

user137227

2014-04-07T03:46:23.367

0 投票

1 回答

3238 浏览

r - Caret 的 train 和confusionMatrix 函数

我试图通过遵循 Max Khun 的 Applied Predictive Modeling 书来了解插入符号的工作原理，但无法理解插入符号的混淆矩阵函数是如何工作的。

我使用 glmnet 训练了训练数据集 (training[, fullSet])，它有 8190 行和 1073 列，如下所示：

然后，我从拟合中打印了混淆矩阵：

当我查看混淆矩阵时，我得到了以下结果：

但是，我不明白为什么混淆表只有 1757 个观察值（1757 = 507 + 208 + 63 + 779），因为插入符号的confusionMatrix.train 文档说“当训练用于调整模型时，它会跟踪混淆矩阵单元保留样本的条目。” 由于训练数据集有 8190 行，我使用了 10 倍的 CV，所以我认为混淆矩阵应该基于 819 个数据点（819 = 8190 / 10），事实并非如此。

显然我不完全理解插入符号的 trainControl 或 train 是如何工作的。有人可以解释我误解了什么吗？

非常感谢你的帮助。

李英进

r r-caret confusion-matrix

2014-04-09T16:22:03.127

0 投票

1 回答

7141 浏览

r - 如何在 R 中实现保留验证

假设我正在使用Sonar数据并且我想在 R 中进行保留验证。我使用createFoldsfromcaret包将数据分区为folds <- createFolds(mydata$Class, k=5).

然后我想完全使用折叠mydata[i]作为测试数据并使用mydata[-i]作为训练数据来训练分类器。

我的第一个想法是使用该train功能，但我找不到任何对保留验证的支持。我在这里错过了什么吗？

另外，我希望能够完全使用预定义的折叠作为参数，而不是让函数对数据进行分区。有人有想法吗？

r machine-learning classification r-caret

2014-04-09T20:02:48.423

1 2 3 4 5 6 7 8 9 10

问题标签 [r-caret]

Reference