0

我有一个不平衡的文本数据集(很多 0 和少数 1)。目前我正在使用带有逻辑回归的监督机器学习模型对它们进行分类。在训练集上,准确率是 98%,但召回率只有 32%。显然,这不是正常的文本分类任务,因为数据非常不平衡,几乎是一个奇怪的检测。

现在我面临着权衡。我知道有一些奇怪的检测算法(例如隔离森林?)。但是时间非常有限。如果我更改算法,我是否应该期望模型的性能有很大提高?或者我应该中止任务,因为逻辑模型显示出糟糕的结果?

4

0 回答 0