1

我有一个这样的数据框:

截屏

因为标签是二元的并且非常不平衡,所以我想使用 ADASYN 进行过采样。如您所见,它实际上是每个用户 30 天的时间序列,所以当我只使用时它没有意义:

ada = ADASYN()  
X_resampled, y_resampled = ada.fit_sample(X, y)

where X = (feature 1, feature 2) and y = label. 

你有什么想法来处理这个问题吗?

4

0 回答 0