machine-learning - 在现实世界中没有恒定平衡时如何平衡您的数据集

Question

我无法决定如何在“困境情况”上平衡我的数据集，因为它不能以“工厂中烂苹果的百分比”来衡量。

目前，我选择只使用“50%-50%”的遇险语音片段和随机的非遇险片段。

我会很高兴收到来自社区的一些建议，在这种情况下最好的做法是什么？我选择了 50-50 方法来避免统计偏差，并且我使用的是顺序 (Keras) 模型。

score 0 · Accepted Answer

如果无法修改数据集，请尝试修改损失函数而不是数据集。但我认为这个问题并没有完全提出。

1 回答 1