问题标签 [cross-validation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2692 浏览

r - 从插入符号模型中收集非折叠预测

我想使用插入符号模型中的非折叠预测来训练包含一些原始预测变量的第二阶段模型。我可以按如下方式收集超出预期的预测:

这很好,但它们的顺序错误:

我知道该train对象返回一个用于训练每个折叠的索引的列表:

如何使用这些信息以out_of_fold与原始数据集相同的顺序将观察结果放入对象中BostonHousing

0 投票
1 回答
3308 浏览

database - 从训练数据集中提取测试集

我有一个数据集(其中每个数据都是带有相应类标签的属性向量)。我想将数据集拆分为训练集和测试集。无论如何可以自动执行此操作吗?

0 投票
1 回答
830 浏览

spring - 在java中实现交叉验证

我使用 Spring Roo + jpa + hibernate,我想在我的应用程序中实现交叉验证(同时验证多个字段)。

我不确定如何实施它。谁能给我建议和/或指导我查阅相关文件?

0 投票
0 回答
171 浏览

machine-learning - 我们如何使用 liblinear 或 livsvm 中的 '-v' 选项分别获得每个折叠的准确性?

在 liblinear 和 libsvm 中,该选项-v k允许我们运行 k 折交叉验证。但是为了测试统计显着性,我需要在每一折上获得的准确性。当然,创建每个折叠然后运行训练和测试 k 次的方法很长,但我想知道即使我使用该-v选项,是否有办法获得每个折叠的准确性。

我认为 liblinear 和 libsvm 对我的问题会有相同的答案。如果我对此有误,请纠正我。

0 投票
0 回答
784 浏览

r - R中lmer对象的k-fold验证包

我需要对 lmer 对象运行 10 倍验证。该模型包括非线性增长曲线的分数多项式变换。

我找不到适用于该模型的 k 折交叉验证包!有任何想法吗?

0 投票
1 回答
591 浏览

python - 交叉验证的附加拟合参数

使用scikit-learn时,有没有办法将附加参数传递fit给分类器的方法cross_val_score?例如,您将如何为分类器指定sample_weightor :class_priorMultinomialNB

scikit-learn的页面关于MultinomialNB

0 投票
2 回答
17025 浏览

matlab - MATLAB:不使用现有函数的 10 倍交叉验证

我有一个矩阵(我猜在 MatLab 中你称之为结构)或数据结构:

这是我的 matrix.data 看起来假设我确实使用矩阵名称加载了我的文件:

这是我的 matrix.labels 看起来像

我正在尝试在不使用 MatLab 中的任何现有函数的情况下创建 10 个交叉折叠验证,并且由于我对 MatLab 的了解非常有限,因此我无法从我所拥有的东西中继续前进。任何帮助都会很棒。

这是我到目前为止所拥有的,我相信这可能不是 matlab 的方式,但我对 matlab 很陌生。

0 投票
0 回答
290 浏览

weka - Weka 交叉验证错误结果

我正在使用贝叶斯网络对 4 个类别的 5 分钟 EEG 数据进行分类。

应用交叉验证时,我得到 100% 正确的结果,而当我在单独的文件中使用训练和提供的测试数据(前 3.7 分钟用于训练,1.3 分钟用于测试)时,我得到的结果非常低(30%)。

我是 Weka 的新手,不知道这怎么可能。任何帮助将不胜感激:)

0 投票
1 回答
311 浏览

svm - ROC能否比较两组特征的分类能力?

我正在学习 SVM 和 ROC。据我所知,人们通常可以使用 ROC(接收器操作特性)曲线来显示 SVM(支持向量机)的分类能力。我想知道是否可以使用相同的概念来比较两个功能子集。

假设我有两个特征子集,子集 A 和子集 B。它们是通过 2 种不同的特征提取方法 A 和 B 从相同的训练数据中选择的。如果我使用这两个特征子集通过 LIBSVM 训练相同的 SVM svmtrain() 函数并绘制它们的 ROC 曲线,我可以通过它们的 AUC 值来比较它们的分类能力吗?因此,如果子集 A 的 AUC 值高于子集 B,我可以得出结论,方法 A 比方法 B 更好吗?这有什么意义吗?

非常感谢你,

0 投票
1 回答
464 浏览

csv - Weka“交叉验证”文件

我有三个与特定文件关联的值。每个文件都属于一个特定的系列。我需要改进 Weka 中的“交叉验证”,以了解我是否能够通过这三个值来识别家庭。现在,创建我必须在 Weka 上打开的 Csv 或 Arff 文件的步骤是什么?我的 txt 有这种格式。

File_Family_1 值 1、值2、值 3

File_Family_1值 1、值2、值 3

File_Family_2值 1、值2、值 3

File_Family_2值 1、值2、值 3

File_Family_3值 1、值2、值 3

File_Family_3值 1、值2、值 3