问题标签 [cross-validation]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2382 问题

0 投票

1 回答

1686 浏览

matlab - 绘制一对多 SVM 中 10 倍交叉验证的结果（使用 LibSVM）

我想libsvmtrain_ova在这个链接中绘制结果： 10 fold cross-validation in one-against-all SVM (using LibSVM)

，我在里面使用了这段代码，libsvmtrain_ova但我认为它不能正常工作。

2012-12-29T17:43:12.527

0 投票

1 回答

847 浏览

matlab - 在matlab中使用带有ar函数的crossval函数的例子？

任何人都可以提供或重定向到一个来源，在那里我可以看到一个简单的crossvalMATLAB 中函数用法示例，其中预测函数是ARorARX函数？

我无法从 MATLAB 的文档或网络中找到示例...

matlab cross-validation

2013-01-14T13:48:40.863

0 投票

1 回答

3521 浏览

r - R caret / rfe 内训练的交叉验证如何工作

我对图书馆的rfe功能有疑问。caret在插入符号主页链接上，他们给出了以下 RFE 算法：算法

在这个例子中，我使用了rfe带有 3 折交叉验证的函数和带有线性支持向量机和 5 折交叉验证的train函数。

从上面的算法中，我假设该算法可以使用 2 个嵌套的交叉验证：
1. rfe将数据（150 个样本）分成 3 折
2. 该train函数将在具有 5 倍交叉验证的训练集（100 个样本）上运行以调整模型参数 - 以及随后的 RFE。

让我困惑的是，当我查看rfe函数的结果时：

由此看来，来自 5 倍 cv 的训练集的大小是 120 个样本，而我预计的大小是 80。

因此，如果有人能阐明rfe和train如何协同工作，那就太好了。

干杯

r cross-validation r-caret rfe

2013-01-22T19:59:11.727

0 投票

1 回答

2047 浏览

machine-learning - weka 是否在交叉验证中平衡跨类的训练/测试集？

当我对 m 个类执行 n 折交叉验证时，在每一折中，训练集和测试集是否平衡？通过平衡，我的意思是询问训练和测试集中每个班级是否（几乎）有相同的样本集。

machine-learning weka cross-validation

2013-01-31T17:29:40.620

0 投票

1 回答

581 浏览

tree - 决策树交叉验证问题

所以我正在编写一个决策树程序。假设我有一个包含 1000 个实例的数据集。据我了解 - 通过交叉验证，我将数据集分成 900-100 个组。每次使用不同的 900 组来创建树并使用 100 组来测试它

我不明白的是这些问题： 1. 我用哪棵树作为我的最终决策树（选择错误最少的那棵不是一个好选择，因为我想这可能是因为过度拟合） 2 . 交叉验证是否仅用于估计最终树中的误差？3. 我发现了一些关于交叉验证的不同算法，一些使用相同的分割标准，还有一些使用不同的标准来选择最好的树——你能给我指出一个有信息的好地方，这样我就可以准确地弄清楚我是什么需要？或者解释一下你自己？

谢谢！

tree data-mining decision-tree cross-validation

2013-02-08T13:03:46.883

0 投票

1 回答

11883 浏览

python - 在 scikit learn 中结合网格搜索和交叉验证

为了改善支持向量机的结果，我必须使用网格搜索来搜索更好的参数和交叉验证。我不确定如何在 scikit-learn 中组合它们。网格搜索搜索最佳参数（http://scikit-learn.org/stable/modules/grid_search.html）和交叉验证避免过度拟合（http://scikit-learn.org/dev/modules/cross_validation.html）

结果：

python svm scikit-learn cross-validation

2013-02-14T01:11:00.630

0 投票

2 回答

5910 浏览

python - TypeError: init() 得到了一个意外的关键字参数“评分”

当明显
TypeError: __init__() got an unexpected keyword argument 'scoring' 的评分是一个参数时（ http://scikit-learn.org/dev/modules /生成/sklearn.grid_search.GridSearchCV.html#sklearn.grid_search.GridSearchCV）？

python svm scikit-learn cross-validation

2013-02-18T00:57:30.947

0 投票

2 回答

9595 浏览

runtime-error - 我在每个类中都有三个以上的元素，但是我得到了这个错误：“类不能小于 scikit-learn 中的 k=3”

这是我的目标（y）：

我不知道为什么我正在执行：

我收到此错误：

runtime-error svm scikit-learn cross-validation

2013-02-18T02:14:07.873

0 投票

1 回答

4833 浏览

r - 插入符号。数据拆分与trainControl的关系

我已经仔细阅读了位于http://caret.r-forge.r-project.org/training.html的 CARET文档，其中的小插曲，一切都很清楚（网站上的示例很有帮助！），但是我仍然对以下两个论点之间的关系感到困惑：trainControl

以及trainControl插入符号中的数据拆分函数之间的相互作用（例如createDataPartition、createResample和）createFoldscreateMultiFolds

为了更好地提出我的问题，让我使用文档中的以下示例：

我的问题是：

如果我使用createDataPartition（我假设它会进行分层引导），如上例所示，并且我将结果传递index给trainControl我是否需要LGOCV在我的调用中用作方法trainControl？如果我使用另一个（例如cv）会有什么不同？在我看来，一旦你修复index了.methodindex
createDataPartition和和有什么不一样createResample？是createDataPartition分层引导，而createResample不是？

3) 如何使用插入符号进行分层k 折（例如 10 折）交叉验证？下面会做吗？

r machine-learning cross-validation

2013-02-19T22:33:29.047

0 投票

0 回答

198 浏览

n-gram - ngram建模，如何进行交叉验证

我试图了解交叉验证在 ngram 模型的上下文中是如何工作的。我知道该模型本质上列出了训练中语料库中每个 ngram 的概率。但是，交叉验证如何工作？我应该调整的参数是什么？我知道我想在验证集上获得 100% 的准确度，但我不确定我需要调整什么才能使其正常工作。它与平滑有关吗？

n-gram cross-validation

2013-02-20T21:54:08.820

1 2 3 4 5 6 7 8 9 10

问题标签 [cross-validation]

Reference