问题标签 [cross-validation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
8670 浏览

r - 如何在 R 中使用 LibSVM 执行 10 倍交叉验证?

我知道在 MatLab 中这很容易('-v 10')。

但我需要在 R 中执行此操作。我确实找到了一条关于添加cross = 10as 参数的评论。但这在帮助文件中没有得到证实,所以我对此持怀疑态度。

任何成功的 R 支持向量机脚本示例也将不胜感激,因为我仍然遇到一些死胡同?

编辑:我忘了在标签之外提到我为此使用 libsvm 包。

0 投票
2 回答
639 浏览

machine-learning - 不具有相等分区的 K 折交叉验证的分区数据

来自维基百科:

在 k 折交叉验证中,原始样本被随机划分为 k 个大小相等的子样本。

我正在做一个 10 折交叉验证项目。我有一个包含 76 个元素的数据集。这意味着我不能拥有相同大小的分区。

剩余数据的方法是什么(在我的示例 6 数据中)?忽略它们,使数据有 16 个元素,6 个分区有 11 个元素等等?

0 投票
2 回答
122 浏览

algorithm - Matlab Taking Particular Rows From Matrix

I am working on implementing cross validation at Matlab without using any other functions except for native ones.

I have a matrix like that:

I have a fold size M

At first iteration I want to take that:

at second iteration:

iterate until I process

When I don't include any set of elements I want to assign them into another variable or I want to know indexes so I can process them (this one is better for performance)

Further information about cross validation: http://en.wikipedia.org/wiki/Cross-validation_(statistics)

This graphic explains what I want(form Georgia Tech University slides): enter image description here

I am new to matlab, how can I implement it easily?

0 投票
1 回答
2020 浏览

matlab - 在 MATLAB 中创建与 classperf 一起使用的分类器

我正在研究一个新模型,并想使用 classperf 来检查我的分类器的性能。我如何让它使用我的分类器而不是内置的分类器之一?我在网上找到的所有示例都使用了 MATLAB 中包含的分类器。我想用K-fold来测试它。

0 投票
1 回答
744 浏览

matlab - 如何在交叉验证的每一折中获得错误分类率?

我目前在 matlab 中使用这种语法来获得 10 倍交叉验证的误分类率:

(其中“池化”是我想用分类器分类的 2 类特征集)

根据我的阅读,mcr将返回 10 倍的平均错误分类率。现在,如果我想从每个折叠中获得错误分类率,我该怎么办?

先感谢您。

0 投票
2 回答
14646 浏览

r - R中逻辑回归的分类表

我有一个数据集,由存储在 csv 文件中的二分因变量 ( Y) 和 12 个自变量 ( X1to ) 组成。X12以下是数据的前 5 行:

我使用以下代码从数据中构建了一个逻辑回归模型:

我可以使用以下代码获得每个数据的预测概率:

现在,我想创建一个分类表 - 使用数据表 ( mydata) 的前 20 行 - 我可以从中确定与数据实际一致的预测概率的百分比。请注意,对于因变量 ( Y),0 表示小于 0.5 的概率,1 表示大于 0.5 的概率。

我花了很多时间试图构建分类但没有成功。如果有人建议可以帮助解决此问题的代码,我将不胜感激。

0 投票
0 回答
431 浏览

weka - WEKA SMOreg 分类器显着性检验

我在 WEKA 中使用 SMOreg 分类器来确定一个变量和其他几个变量之间是否存在预测关系。我正在使用 10 倍交叉验证来获得我的结果。我的老师希望我找到自己发现的信心,但这让我感到困惑,因为我认为这是不可能的。如何使用 WEKA 中的 SMOreg 分类器测试显着性?

0 投票
1 回答
2145 浏览

k-means - k 表示交叉验证

我得到了一份包含贫困、人口等数据的美国县列表,并使用 ak 均值算法进行了聚类。我按如下方式交叉验证了聚类:我将县分为训练集和保留集。在聚类过程中我将贫困特征排除在外,然后对于坚持集中的每个县,我找到最近的聚类,然后从最近聚类的平均贫困中减去县的贫困。最后,我将上面的差平方,对坚持集中的每个县求和,然后除以坚持集中的县数。然后我也做了同样的事情,但这次贫困特征参与了聚类。我观察到错误明显低于以前,但我读到这在某种程度上是“作弊”。

0 投票
1 回答
594 浏览

matlab - MATLAB - cvpartition 的“k”和“kfold”分区类型之间的区别

有人可以向我解释一下差异及其对使用分层 10 倍交叉验证程序(由“k”分区类型表示)或 10 倍交叉验证程序(如“kfold”分区表示)对数据分区的影响类型)。

我的意图是使用此分区来执行交叉验证过程,以使用 bootstrap 集成进行时间序列分析。在这种情况下,哪种分区类型更适合对我的解释变量进行分区以尽可能适合我的响应变量?

任何帮助表示赞赏。

谢谢

0 投票
1 回答
514 浏览

r - 交叉验证季节性线性模型

我正在尝试对我的线性模型执行 CV,该模型具有季节性虚拟变量,所以我不能随机抽样。

我的简历功能是:

例子:

不同视野 ( h )的 MAE 值太接近。代码本身是否有效?有没有更好的解决方案/包来做到这一点?

谢谢!