我有一个不平衡的数据集,我想使用 SMOTE。我正在使用 Azure ML。我在 Microsoft Doku 页面中阅读了许多示例。我想知道为什么 SMOTE 设置在 SPLIT DATA 函数之前,而不是在 70% 数据集上的 SPLIT DATA 之后进行训练。我看到的所有示例都在 SPLIT DATA 函数之前。这是 SMOTE 的正确用法吗?
这是来自 Microsoft 的示例: https ://imaginemedia.blob.core.windows.net/content/Lab%20PDF%20-%20Churn%20Prevention%20and%20Intervention-db9732e3e8c6.pdf