问题标签 [r-caret]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
701 浏览

r - 插入符号包中的 createGrid 函数 - 它被删除了吗?

caret在 R(版本 3.0.2)中使用包(版本 6.0-24)。该功能createGrid实际上已被删除?在caret5.17-7 版本中,该功能仍然存在。

0 投票
1 回答
10513 浏览

r - R中CARET包中的createTimeSlices函数

我正在处理多元金融时间序列数据并且在使用该createTimeSlices函数时遇到问题。除了Max Kuhn使用的功能外,我找不到该功能的任何用途。任何人都可以帮助我了解该功能的用法吗?

0 投票
0 回答
102 浏览

r - R中的内存问题

我正在尝试用一个训练集训练一个 k-NN 模型,该训练集包括 350k 观察和 3 个特征(所有三个都是 40、50 和 100 个级别的分类)。我正在使用 caret 包中的 knnreg,因为我的目标向量是连续的。

我的机器很弱,有 4GB 的 RAM。我还尝试了具有相同数据集的其他算法,并且遇到了类似的错误。

当我运行预测函数时弹出错误,我并不感到惊讶。在示例中,我仅运行 1 个观察结果:

  1. 为什么在我运行预测函数(而不是 knnreg)时会弹出错误?
  2. 有没有办法解决这个问题?
0 投票
1 回答
2728 浏览

r - R中的k-NN回归问题

我正在尝试从包插入符号运行 knnreg。出于某种原因,此训练集有效:

虽然这个不起作用:

这是目标向量:

我得到的错误是在预测阶段:

虽然这是我的测试集:

我错过了什么?

编辑:将 V4 集标签切换为“1”、“2”……实际上可以解决问题。算法是否将我的特征视为数字特征,即使它们是因子?

0 投票
1 回答
658 浏览

r - 无法在 R 中查看包的源代码

我正在尝试在插入符号中查看函数 knnreg 的源代码。

发生了什么?源代码在哪里?

0 投票
1 回答
1512 浏览

r - 插入符号包的性能非常慢,具有多核

我正在阅读caret包作者的《应用预测建模》一书。

第一个 svm 训练示例需要几个小时才能在我的 64 位 i7 16 GB xubuntu 桌面上运行 [我在 4 小时后放弃了]。由于这是一个“玩具”数据集 [800 行,42 个变量],因此肯定有一种方法可以在合理的时间内运行它。

问题:如果这段代码是正确的,它如何在合理的时间内运行?

0 投票
1 回答
2487 浏览

r - C50 通过插入符号包苦苦挣扎

我正在为 C50 包的插入符号火车包装而苦苦挣扎。我正在尝试拟合预测模型

我明白了

我的会话信息是

提前致谢

0 投票
2 回答
49816 浏览

r - 使用 Caret 在 R 中为 k-fold CV 创建折叠

我正在尝试使用 http://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/上提供的数据为几种分类方法/超参数制作 k 折 CV声纳.所有数据

该集合由 208 行组成,每行有 60 个属性。我正在使用 read.table 函数将它读入 data.frame 中。

下一步是将我的数据分成 k 折,假设 k = 5。我的第一次尝试是使用

我有两个问题。第一个是褶皱的长度不相邻:

另一个是这显然根据属性索引拆分了我的数据,但我想拆分数据本身。我认为通过转置我的data.frame,使用:

但是当我调用 createFolds 函数时,它给了我这样的信息:

长度问题已解决,但它仍然没有相应地拆分我的 208 数据。

我可以做什么?插入符号包可能不是最合适的吗?

0 投票
1 回答
3238 浏览

r - Caret 的 train 和confusionMatrix 函数

我试图通过遵循 Max Khun 的 Applied Predictive Modeling 书来了解插入符号的工作原理,但无法理解插入符号的混淆矩阵函数是如何工作的。

我使用 glmnet 训练了训练数据集 (training[, fullSet]),它有 8190 行和 1073 列,如下所示:

然后,我从拟合中打印了混淆矩阵:

当我查看混淆矩阵时,我得到了以下结果:

但是,我不明白为什么混淆表只有 1757 个观察值(1757 = 507 + 208 + 63 + 779),因为插入符号的confusionMatrix.train 文档说“当训练用于调整模型时,它会跟踪混淆矩阵单元保留样本的条目。” 由于训练数据集有 8190 行,我使用了 10 倍的 CV,所以我认为混淆矩阵应该基于 819 个数据点(819 = 8190 / 10),事实并非如此。

显然我不完全理解插入符号的 trainControl 或 train 是如何工作的。有人可以解释我误解了什么吗?

非常感谢你的帮助。

李英进

0 投票
1 回答
7141 浏览

r - 如何在 R 中实现保留验证

假设我正在使用Sonar数据并且我想在 R 中进行保留验证。我使用createFoldsfromcaret包将数据分区为folds <- createFolds(mydata$Class, k=5).

然后我想完全使用折叠mydata[i]作为测试数据并使用mydata[-i]作为训练数据来训练分类器。

我的第一个想法是使用该train功能,但我找不到任何对保留验证的支持。我在这里错过了什么吗?

另外,我希望能够完全使用预定义的折叠作为参数,而不是让函数对数据进行分区。有人有想法吗?