1

我使用逻辑回归编写了一个多类分类器,该分类器使用一对多的方法进行训练。我想为经过训练的分类器绘制学习曲线。

学习曲线应该逐个类别地绘制,还是应该是整个分类器的单个图?这有什么不同吗?

为了澄清,学习曲线是训练和交叉验证/测试集错误/成本与训练集大小的关系图。该图应该允许您查看增加训练集大小是否会提高性能。更一般地说,学习曲线允许您确定您的算法是否存在偏差(欠拟合)或方差(过拟合)问题。

关于我的代码的一些细节:

  • 分析 MNIST 手写数字图像
  • 预测图像中的数字 (0-9)
  • 基于 Andrew Ng 的 Coursera 机器学习课程
4

1 回答 1

1

一般来说,我会绘制所有的东西。或者编写一个脚本来收集所有内容并将其全部绘制出来。

我认为对整个分类器图的需求是显而易见的。但我认为逐个班级的课程对确保您在一个班级没有问题很有价值。如果说,“5”顽固地抵抗增加的训练数据,但整体分类器仍然受到它的帮助,我宁愿在我倾注更多数据之前调查那一类的情况。

于 2015-05-31T00:21:51.120 回答