1

我在多标签、多类分类任务中遇到问题。我有一个大小为 33000 的数据集,每个样本包含 104 个类。我将数据集拆分为 16500 个样本,其标签包括 [1, 0, 1, 0, 0, ...], [0, 1, 1, 0, 1, ...], [1, 0, 0, 0](每个label 中至少有一个元素 1)和 16500 个标签,例如 [0, 0, 0, ...], [0, 0, 0, ...](所有标签中的所有元素都是 0)。在计算每个类的 pos_count 时,类 0 的数字 pos_count_0 是我的数据集中每个标签的第一个位置出现的 1 的数量。对于第 1 类,pos_count_1 为第二个位置的 1 的个数,依此类推。之后,第 0 类的 pos_weight 为 (33000-pos_count_0)/pos_count_0,第 1 类的 pos_weight 为 (33000-pos_count_1)/pos_count_1 ?我有点困惑如何计算一个类的 neg_count 和 pos_count 。

4

0 回答 0