我有一个标记为 3 个类的文本数据,第 1 类有 1% 的数据,第 2 类 - 69% 和第 3 类 - 30%。总数据量为 10000。我正在使用 10 倍交叉验证。对于分类,scikit learn python 库的 SVM 与 class_weight=auto 一起使用。但是 10 倍 CV 的 1 步的代码已经运行了 2 小时,还没有完成。这意味着代码至少需要 20 小时才能完成。在不添加 class_weight=auto 的情况下,它会在 10-15 分钟内完成。但是,输出中没有数据被标记为 1 类。有没有办法解决这个问题?
问问题
2898 次