我正在用 Python 制作机器学习模型,数据集中只有分类变量。我想要最小 90% 的精度(对于因变量中的值 1)。
在原始数据(我从数据库中提取的原始 YTD 数据)中,1 与 0 的比率为 61:39,但这会有所不同。两个月前,这个比例是 75:25。我没有得到我想要的数据精度。经过反复试验,我意识到如果 1 与 0 的比率为 85:15,那么我能够获得 1 和 0) 的精度均高于 90%。换句话说,1 和 0 的预测正确率都超过 90%。请注意,我没有进行过采样或欠采样。我只是删除了一些因变量值为 0 的行,以获得 1:0 的比率为 85:15。
我想知道这种方法是否正确。
谢谢