问题标签 [k-fold]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
37 浏览

r - 在神经网络分析中使用什么值?

我有以下练习:

  • 使用 k 折交叉验证创建神经网络。评估不同配置的性能。

在此之后,我应该将这些值与使用决策树模型获得的值进行比较,以获得相同的数据。

对于给定的数据:

在此处输入图像描述

我必须规范化这些值,并且我能够规范化它们。但问题是,更改比赛字段中的值是否有意义,例如:

  • 亚洲 - 0
  • 白色 - 1
  • 其他 - 2

然后将值标准化(0 到 1),还是应该只使用“年龄”、“薪水”和“学术水平”字段?

因变量将是一个新列,将薪水分为“高”和“低”。

在神经网络中规范化和使用哪些领域是有意义的?我可以对所有这些进行归一化并使用神经网络中的所有字段吗?

0 投票
1 回答
53 浏览

r - 模型选择是否使用交叉验证?

所以这开始让我有点困惑。例如,具有以下训练 GLM 模型的代码:

我预计这会训练几个模型,然后选择在灵敏度上表现最好的模型。然而,当我阅读交叉验证时,我发现最多的是它如何用于计算平均性能分数。

我的假设错了吗?

0 投票
1 回答
954 浏览

r - 使用 spTransform 将 SpatialPolygonsDataFrame 转换为投影坐标

我正在尝试进行点模式分析。为此,我必须转换 SpatialPolygonsDataFrame,使其包含投影坐标而不是弯曲坐标。但是我不断收到同样的错误:

as.owin.SpatialPolygons(Netherlands_flat) 中的错误:只能将投影坐标转换​​为 spatstat 类对象

这是我用于边框的数据:

我能够用事件来绘制荷兰的情节。

有活动的荷兰

但是在使用 Spatstat 包时,我一直遇到这个错误。

我试过这段代码来转换坐标

as.owin.SpatialPolygons(Netherlands_flat) 中的错误:只能将投影坐标转换​​为 spatstat 类对象

有谁知道如何解决这个问题?非常感谢您!

0 投票
1 回答
517 浏览

python - 如何使用 pytorch 的 cat 函数进行 K-Fold 验证(即将 pytorch 块列表连接在一起)

我正在为 k 折交叉验证拆分数据集,但在使用 Pytorch 的 stack/cat 函数连接张量列表时遇到问题。

首先,我使用 .chunk 方法将训练集和测试集分成块,如下所示

其中 x_train 是 torch.Size([5000, 3, 32, 32]) 的张量,y_train 是 torch.Size([5000]) 的张量

x_train_folds 和 y_train_folds 现在是 num_folds 张量的元组

然后,我需要设置一系列嵌套循环来遍历 K 的不同值和各种折叠,同时始终从训练集中排除一个折叠以在测试/验证时使用:

如您所见,我总是从原始训练集中跳过一倍以用于验证。这是标准的 K 折交叉验证。

不幸的是,我收到以下错误,我似乎无法弄清楚: TypeError: expected Tensor as element 0 in argument 0, but got tuple

正如您在 API 列表中看到的那样,.cat 似乎需要一个张量元组,这就是我所拥有的。 https://pytorch.org/docs/stable/torch.html#torch.cat

有没有人有什么建议?

非常感谢 - 德鲁

0 投票
1 回答
46 浏览

machine-learning - 误差随k值变化的变化

当我研究 K-fold 时,我想知道 CV-error。随着折叠数的增加,估计的交叉验证误差会更高或更小或没有变化(平均)?

我认为 CV 错误会下降。

0 投票
1 回答
420 浏览

python - cross_val_score 不适合实际的输入模型吗?

我正在处理一个处理大型数据集的项目。

我需要在 Sklearn 的 KFold 交叉验证库中训练 SVM 分类器。

我正在使用上述代码。我知道我正在使用 cross_val_score 函数训练我的分类器,因此每当我尝试在外部调用分类器以预测测试数据时,我都会收到错误消息:

有没有其他选择以正确的方式做同样的事情?

请帮我解决这个问题。

0 投票
0 回答
35 浏览

python - KFold 函数 TypeError:此 dtype 不允许缩减操作“argmax”

我定义了一个函数来打印 K 折叠分数并确定最佳 c,但是在下面的代码中的这一行中出现错误(我也在代码中突出显示了该行):

best_c = results_table.loc[results_table['平均召回分数'].idxmax()]['C_parameter']

我得到的错误是

0 投票
2 回答
85 浏览

python-3.x - Keras 的数据重塑不使用 K-Fold 验证

我有一个数据集,我正在为 Keras 网络塑造如下:

整形的结果是这样y.shape = (13609, 5)X_data.shape = (13609, 61, 1)

然后,我尝试在数据集上使用 KFold Validation,并将 Keras 神经网络包装到以下循环中:

该网络在没有 KFold 验证的情况下在循环之外作为独立的工作正常,但在此循环内不能正常工作。

我得到的错误是这个

但我不明白二维发生在哪里。

我怀疑我错误地使用了 Kfold for 循环,但我找不到原因。任何人都可以对此提出一些建议吗?谢谢

0 投票
1 回答
109 浏览

python - 选择 K-Fold 交叉验证值的问题

对于信息学课程,已经给出了实现 Cholesky 分解并为 LS 解决方案选择 KFold 交叉验证的最佳值。问题是当我尝试一些不同于 2 的 KFold 值时,我收到以下错误,即两个矩阵的维度不匹配。事实是我无法重塑矩阵。任何想法?谢谢

0 投票
0 回答
360 浏览

cross-validation - 使用五折交叉验证训练网络时,有的折叠效果好有的效果很差,怎么办

我正在尝试为数据集(0 类 = 77 个图像,1 类 = 41 个图像)创建一个二进制 CNN 分类器,我想做 5 倍交叉验证。在每一折中,使用验证集保存最佳模型,并共享相同的模型、超参数和训练策略。这是我的结果。

  • fold - 测试集的准确性
  • 折叠 0 - 0.68
  • 折叠1 - 0.71
  • 折叠 2 - 0.91
  • 折叠 3 - 0.96
  • 折叠 4 - 0.64

我的问题是:通过更改超参数进行微调。发现 fold2 和 fold3 每次都表现更好,但 fold0 和 fold4 表现不佳。是什么愿意造成它,我应该怎么做。

可能的问题是每次初始化都是随机的。

谢谢大家的答案。