machine-learning - 噪声数据的学习曲线

Question

我正在对小文本进行监督分类，数据非常嘈杂。我绘制了一条学习曲线：x 轴是 # 个实例。y轴是F-measure的值。曲线正在下降：我使用的实例越多，F-measure 得分越低。它是典型的嘈杂数据吗？或者这种行为还有其他原因？

score 1 · Accepted Answer

您是使用训练集还是测试集计算 F-measure 的？

如果您使用训练集计算它，那么学习曲线下降是很正常的。

如果你使用测试集计算，那么可能有很多原因，最有可能的是训练集和测试集不是独立同分布的。

1 回答 1