1

在 python 中,我试图重新平衡一个数据集,该数据集包含一个信用卡号的大约 4000 个交易,这些交易都是按时间排序的。

真实交易和欺诈交易之间存在很大的类别不平衡,该数据仅包含大约 15 次发生在两天内的欺诈交易。

自然,我想重新平衡数据集。但是,当我使用 SMOTE 执行此操作时,我注意到现在大约有 4000 个额外的合成欺诈交易发生在与原始欺诈交易一样的两天内。

有没有办法生成比这更随机的合​​成欺诈交易?

4

0 回答 0