-1

我有 5 个不同的标签,频率百分比如下:

 '0': 23.21%
 '1': 17.64%
 '2': 29.64%
 '3': 16.96%
 '4': 12.57%

我如何评估这是否会严重影响我的预测?我有大约 1800 条记录,每条记录有 28 个特征。

我考虑过使用混淆矩阵的交叉验证,但我对此不太确定

4

1 回答 1

0

您可以使用将每个标签的样本数考虑在内的性能度量,例如微观或加权平均 F1 分数

于 2020-05-16T10:45:12.487 回答