我无法决定如何在“困境情况”上平衡我的数据集,因为它不能以“工厂中烂苹果的百分比”来衡量。
目前,我选择只使用“50%-50%”的遇险语音片段和随机的非遇险片段。
我会很高兴收到来自社区的一些建议,在这种情况下最好的做法是什么?我选择了 50-50 方法来避免统计偏差,并且我使用的是顺序 (Keras) 模型。
我无法决定如何在“困境情况”上平衡我的数据集,因为它不能以“工厂中烂苹果的百分比”来衡量。
目前,我选择只使用“50%-50%”的遇险语音片段和随机的非遇险片段。
我会很高兴收到来自社区的一些建议,在这种情况下最好的做法是什么?我选择了 50-50 方法来避免统计偏差,并且我使用的是顺序 (Keras) 模型。