Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在对小文本进行监督分类,数据非常嘈杂。我绘制了一条学习曲线:x 轴是 # 个实例。y轴是F-measure的值。曲线正在下降:我使用的实例越多,F-measure 得分越低。它是典型的嘈杂数据吗?或者这种行为还有其他原因?
您是使用训练集还是测试集计算 F-measure 的?
如果您使用训练集计算它,那么学习曲线下降是很正常的。
如果你使用测试集计算,那么可能有很多原因,最有可能的是训练集和测试集不是独立同分布的。