我在我的程序中使用liblinear来使用求解器执行多类分类L2R_L2LOSS_SVC_DUAL
。在当前的测试设置中,我有来自 9 个类的 1600 个实例,每个类有 1000 个特征。
我正在尝试使用 5 倍交叉验证来确定用于训练的最佳 C 参数,但即使 C 为 1.0 liblinear 也能达到最大迭代次数:
................................................................................
....................
optimization finished, #iter = 1000
WARNING: reaching max number of iterations
Using -s 2 may be faster (also see FAQ)
Objective value = -637.100923
nSV = 783
常见问题解答网站提到了两个可能的原因:
- 数据未按比例缩放。
- 使用了较大的 C 参数。
- 使用了大量具有少量特征的实例,因此求解器
L2R_L2LOSS_SVC
可能更快。
两者都不适用于我的情况。因为我的特征向量是某种直方图,所以有一个自然最大值,我用它来将特征缩放到 [0,1]。
我将 liblinear 的参数设置如下:
struct parameter svmParams;
svmParams.solver_type = L2R_L2LOSS_SVC_DUAL;
svmParams.eps = 0.1;
svmParams.nr_weight = 0;
svmParams.weight_label = NULL;
svmParams.weight = NULL;
svmParams.p = 0.1;
svmParams.C = 1.0;
我的问题是:FAQ 中未提及的其他哪些原因可能会导致 liblinear 在这种情况下运行缓慢,我该怎么做?