0

1 交叉验证数据设计 Iris 数据集由 150 个具有 1 个整数标签的 4 维向量样本组成。有 3 个不同的标签,每个标签正好有 50 个样本。我们首先要进行 5 折交叉验证,如下所示:

  1. 第1类,将数据分为5折:样本号1-10、11-20、21-30、31-40、41-50,分别命名为f11、f12、f13、f14、f15 .

  2. 对于第 2 类,其折叠为 f21、f22、f23、f24 和 f25。

  3. 对于第 3 类,其折叠为 f31、f32、f33、f34 和 f35。

  4. 通过 R1 = {f11, . . ., f14, f21, . . ., f24, f31, . . ., f34 },以及由 T1 = {f15, f25, f35 } 设置的测试集。

  5. 使用 R1 训练上述 6 个高斯分类器,在 T1 上计算准确率。

  6. 对 R2-R5 和 T2-T5 重复上述操作,以获得 5 个精度。

  7. 找到平均准确度,并确定鸢尾花数据集的最佳高斯分类器。

2 支持向量机 SVM 的超参数是 C(不可分离性)和内核特定的参数。使用 5 折交叉验证

  1. 确定多项式核函数的最佳 C 和次数(阶、秩等)。
  2. 确定最佳C和高斯核函数的标准差(或称为

RBF 内核的参数)。这些超参数选择过程称为网格搜索,因为离散参数选择的组合构成了多维向量空间中的网格,我们查看每个网格以找到最佳超参数集。关键的设计问题是离散连续参数空间的选择:例如,通常选择 C ​​= {1, 10, 100, . . .}。

4

0 回答 0