“k-fold”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

37 浏览

r - 在神经网络分析中使用什么值？

我有以下练习：

使用 k 折交叉验证创建神经网络。评估不同配置的性能。

在此之后，我应该将这些值与使用决策树模型获得的值进行比较，以获得相同的数据。

对于给定的数据：

我必须规范化这些值，并且我能够规范化它们。但问题是，更改比赛字段中的值是否有意义，例如：

亚洲 - 0
白色 - 1
其他 - 2

然后将值标准化（0 到 1），还是应该只使用“年龄”、“薪水”和“学术水平”字段？

因变量将是一个新列，将薪水分为“高”和“低”。

在神经网络中规范化和使用哪些领域是有意义的？我可以对所有这些进行归一化并使用神经网络中的所有字段吗？

r neural-network decision-tree k-fold

0 投票

1 回答

53 浏览

r - 模型选择是否使用交叉验证？

所以这开始让我有点困惑。例如，具有以下训练 GLM 模型的代码：

我预计这会训练几个模型，然后选择在灵敏度上表现最好的模型。然而，当我阅读交叉验证时，我发现最多的是它如何用于计算平均性能分数。

我的假设错了吗？

r machine-learning cross-validation r-caret k-fold

0 投票

1 回答

954 浏览

r - 使用 spTransform 将 SpatialPolygonsDataFrame 转换为投影坐标

我正在尝试进行点模式分析。为此，我必须转换 SpatialPolygonsDataFrame，使其包含投影坐标而不是弯曲坐标。但是我不断收到同样的错误：

as.owin.SpatialPolygons(Netherlands_flat) 中的错误：只能将投影坐标转换为 spatstat 类对象

这是我用于边框的数据：

我能够用事件来绘制荷兰的情节。

有活动的荷兰

但是在使用 Spatstat 包时，我一直遇到这个错误。

我试过这段代码来转换坐标

as.owin.SpatialPolygons(Netherlands_flat) 中的错误：只能将投影坐标转换为 spatstat 类对象

有谁知道如何解决这个问题？非常感谢您！

r coordinates spatstat k-fold

0 投票

1 回答

517 浏览

python - 如何使用 pytorch 的 cat 函数进行 K-Fold 验证（即将 pytorch 块列表连接在一起）

我正在为 k 折交叉验证拆分数据集，但在使用 Pytorch 的 stack/cat 函数连接张量列表时遇到问题。

首先，我使用 .chunk 方法将训练集和测试集分成块，如下所示

其中 x_train 是 torch.Size([5000, 3, 32, 32]) 的张量，y_train 是 torch.Size([5000]) 的张量

x_train_folds 和 y_train_folds 现在是 num_folds 张量的元组

然后，我需要设置一系列嵌套循环来遍历 K 的不同值和各种折叠，同时始终从训练集中排除一个折叠以在测试/验证时使用：

如您所见，我总是从原始训练集中跳过一倍以用于验证。这是标准的 K 折交叉验证。

不幸的是，我收到以下错误，我似乎无法弄清楚： TypeError: expected Tensor as element 0 in argument 0, but got tuple

正如您在 API 列表中看到的那样，.cat 似乎需要一个张量元组，这就是我所拥有的。 https://pytorch.org/docs/stable/torch.html#torch.cat

有没有人有什么建议？

非常感谢 - 德鲁

python deep-learning pytorch k-fold

0 投票

1 回答

46 浏览

machine-learning - 误差随k值变化的变化

当我研究 K-fold 时，我想知道 CV-error。随着折叠数的增加，估计的交叉验证误差会更高或更小或没有变化（平均）？

我认为 CV 错误会下降。

machine-learning cross-validation k-fold

0 投票

1 回答

420 浏览

python - cross_val_score 不适合实际的输入模型吗？

我正在处理一个处理大型数据集的项目。

我需要在 Sklearn 的 KFold 交叉验证库中训练 SVM 分类器。

我正在使用上述代码。我知道我正在使用 cross_val_score 函数训练我的分类器，因此每当我尝试在外部调用分类器以预测测试数据时，我都会收到错误消息：

有没有其他选择以正确的方式做同样的事情？

请帮我解决这个问题。

python machine-learning scikit-learn svm k-fold

0 投票

0 回答

35 浏览

python - KFold 函数 TypeError：此 dtype 不允许缩减操作“argmax”

我定义了一个函数来打印 K 折叠分数并确定最佳 c，但是在下面的代码中的这一行中出现错误（我也在代码中突出显示了该行）：

best_c = results_table.loc[results_table['平均召回分数'].idxmax()]['C_parameter']

我得到的错误是

python function typeerror k-fold argmax

0 投票

2 回答

85 浏览

python-3.x - Keras 的数据重塑不使用 K-Fold 验证

我有一个数据集，我正在为 Keras 网络塑造如下：

整形的结果是这样y.shape = (13609, 5)的X_data.shape = (13609, 61, 1)

然后，我尝试在数据集上使用 KFold Validation，并将 Keras 神经网络包装到以下循环中：

该网络在没有 KFold 验证的情况下在循环之外作为独立的工作正常，但在此循环内不能正常工作。

我得到的错误是这个

但我不明白二维发生在哪里。

我怀疑我错误地使用了 Kfold for 循环，但我找不到原因。任何人都可以对此提出一些建议吗？谢谢

python-3.x keras neural-network k-fold

0 投票

1 回答

109 浏览

python - 选择 K-Fold 交叉验证值的问题

对于信息学课程，已经给出了实现 Cholesky 分解并为 LS 解决方案选择 KFold 交叉验证的最佳值。问题是当我尝试一些不同于 2 的 KFold 值时，我收到以下错误，即两个矩阵的维度不匹配。事实是我无法重塑矩阵。任何想法？谢谢

python machine-learning regression least-squares k-fold

0 投票

0 回答

360 浏览

cross-validation - 使用五折交叉验证训练网络时，有的折叠效果好有的效果很差，怎么办

我正在尝试为数据集（0 类 = 77 个图像，1 类 = 41 个图像）创建一个二进制 CNN 分类器，我想做 5 倍交叉验证。在每一折中，使用验证集保存最佳模型，并共享相同的模型、超参数和训练策略。这是我的结果。

fold - 测试集的准确性
折叠 0 - 0.68
折叠1 - 0.71
折叠 2 - 0.91
折叠 3 - 0.96
折叠 4 - 0.64

我的问题是：通过更改超参数进行微调。发现 fold2 和 fold3 每次都表现更好，但 fold0 和 fold4 表现不佳。是什么愿意造成它，我应该怎么做。

可能的问题是每次初始化都是随机的。

谢谢大家的答案。

cross-validation k-fold

问题标签 [k-fold]

Reference