我有一个包含 9 个特征和 1300 行的数据集。我试图在我拥有的当前数据上生成合成数据。输出分为 2 个选项。即 1 和 0 是(1-是和 0-否)这里的问题是几乎 1100 个案例的输出为“0”,而 200 个案例的输出为“1”。以前,我尝试过训练,但结果并不好。我的教授建议我研究合成数据并增加输出“1”的案例,以便有助于开发机器学习模型。我对合成数据一无所知。我承认。我只是不知道从哪里开始。有人可以帮忙吗?如何解决这类问题。任何建议表示赞赏?任何参考代码都对学习有用。谢谢
问问题
257 次