问题标签 [r-caret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 插入符号包中的 createGrid 函数 - 它被删除了吗?
我caret
在 R(版本 3.0.2)中使用包(版本 6.0-24)。该功能createGrid
实际上已被删除?在caret
5.17-7 版本中,该功能仍然存在。
r - R中CARET包中的createTimeSlices函数
我正在处理多元金融时间序列数据并且在使用该createTimeSlices
函数时遇到问题。除了Max Kuhn使用的功能外,我找不到该功能的任何用途。任何人都可以帮助我了解该功能的用法吗?
r - R中的内存问题
我正在尝试用一个训练集训练一个 k-NN 模型,该训练集包括 350k 观察和 3 个特征(所有三个都是 40、50 和 100 个级别的分类)。我正在使用 caret 包中的 knnreg,因为我的目标向量是连续的。
我的机器很弱,有 4GB 的 RAM。我还尝试了具有相同数据集的其他算法,并且遇到了类似的错误。
当我运行预测函数时弹出错误,我并不感到惊讶。在示例中,我仅运行 1 个观察结果:
- 为什么在我运行预测函数(而不是 knnreg)时会弹出错误?
- 有没有办法解决这个问题?
r - R中的k-NN回归问题
我正在尝试从包插入符号运行 knnreg。出于某种原因,此训练集有效:
虽然这个不起作用:
这是目标向量:
我得到的错误是在预测阶段:
虽然这是我的测试集:
我错过了什么?
编辑:将 V4 集标签切换为“1”、“2”……实际上可以解决问题。算法是否将我的特征视为数字特征,即使它们是因子?
r - 无法在 R 中查看包的源代码
我正在尝试在插入符号中查看函数 knnreg 的源代码。
发生了什么?源代码在哪里?
r - 插入符号包的性能非常慢,具有多核
我正在阅读caret包作者的《应用预测建模》一书。
第一个 svm 训练示例需要几个小时才能在我的 64 位 i7 16 GB xubuntu 桌面上运行 [我在 4 小时后放弃了]。由于这是一个“玩具”数据集 [800 行,42 个变量],因此肯定有一种方法可以在合理的时间内运行它。
问题:如果这段代码是正确的,它如何在合理的时间内运行?
r - C50 通过插入符号包苦苦挣扎
我正在为 C50 包的插入符号火车包装而苦苦挣扎。我正在尝试拟合预测模型
和
我明白了
我的会话信息是
提前致谢
r - 使用 Caret 在 R 中为 k-fold CV 创建折叠
该集合由 208 行组成,每行有 60 个属性。我正在使用 read.table 函数将它读入 data.frame 中。
下一步是将我的数据分成 k 折,假设 k = 5。我的第一次尝试是使用
我有两个问题。第一个是褶皱的长度不相邻:
另一个是这显然根据属性索引拆分了我的数据,但我想拆分数据本身。我认为通过转置我的data.frame,使用:
但是当我调用 createFolds 函数时,它给了我这样的信息:
长度问题已解决,但它仍然没有相应地拆分我的 208 数据。
我可以做什么?插入符号包可能不是最合适的吗?
r - Caret 的 train 和confusionMatrix 函数
我试图通过遵循 Max Khun 的 Applied Predictive Modeling 书来了解插入符号的工作原理,但无法理解插入符号的混淆矩阵函数是如何工作的。
我使用 glmnet 训练了训练数据集 (training[, fullSet]),它有 8190 行和 1073 列,如下所示:
然后,我从拟合中打印了混淆矩阵:
当我查看混淆矩阵时,我得到了以下结果:
但是,我不明白为什么混淆表只有 1757 个观察值(1757 = 507 + 208 + 63 + 779),因为插入符号的confusionMatrix.train 文档说“当训练用于调整模型时,它会跟踪混淆矩阵单元保留样本的条目。” 由于训练数据集有 8190 行,我使用了 10 倍的 CV,所以我认为混淆矩阵应该基于 819 个数据点(819 = 8190 / 10),事实并非如此。
显然我不完全理解插入符号的 trainControl 或 train 是如何工作的。有人可以解释我误解了什么吗?
非常感谢你的帮助。
李英进
r - 如何在 R 中实现保留验证
假设我正在使用Sonar
数据并且我想在 R 中进行保留验证。我使用createFolds
fromcaret
包将数据分区为folds <- createFolds(mydata$Class, k=5)
.
然后我想完全使用折叠mydata[i]
作为测试数据并使用mydata[-i]
作为训练数据来训练分类器。
我的第一个想法是使用该train
功能,但我找不到任何对保留验证的支持。我在这里错过了什么吗?
另外,我希望能够完全使用预定义的折叠作为参数,而不是让函数对数据进行分区。有人有想法吗?