在 python 中,我试图重新平衡一个数据集,该数据集包含一个信用卡号的大约 4000 个交易,这些交易都是按时间排序的。
真实交易和欺诈交易之间存在很大的类别不平衡,该数据仅包含大约 15 次发生在两天内的欺诈交易。
自然,我想重新平衡数据集。但是,当我使用 SMOTE 执行此操作时,我注意到现在大约有 4000 个额外的合成欺诈交易发生在与原始欺诈交易一样的两天内。
有没有办法生成比这更随机的合成欺诈交易?
在 python 中,我试图重新平衡一个数据集,该数据集包含一个信用卡号的大约 4000 个交易,这些交易都是按时间排序的。
真实交易和欺诈交易之间存在很大的类别不平衡,该数据仅包含大约 15 次发生在两天内的欺诈交易。
自然,我想重新平衡数据集。但是,当我使用 SMOTE 执行此操作时,我注意到现在大约有 4000 个额外的合成欺诈交易发生在与原始欺诈交易一样的两天内。
有没有办法生成比这更随机的合成欺诈交易?