我有一个这样的数据框:
因为标签是二元的并且非常不平衡,所以我想使用 ADASYN 进行过采样。如您所见,它实际上是每个用户 30 天的时间序列,所以当我只使用时它没有意义:
ada = ADASYN()
X_resampled, y_resampled = ada.fit_sample(X, y)
where X = (feature 1, feature 2) and y = label.
你有什么想法来处理这个问题吗?
我有一个这样的数据框:
因为标签是二元的并且非常不平衡,所以我想使用 ADASYN 进行过采样。如您所见,它实际上是每个用户 30 天的时间序列,所以当我只使用时它没有意义:
ada = ADASYN()
X_resampled, y_resampled = ada.fit_sample(X, y)
where X = (feature 1, feature 2) and y = label.
你有什么想法来处理这个问题吗?