5

我在我的程序中使用liblinear来使用求解器执行多类分类L2R_L2LOSS_SVC_DUAL。在当前的测试设置中,我有来自 9 个类的 1600 个实例,每个类有 1000 个特征。

我正在尝试使用 5 倍交叉验证来确定用于训练的最佳 C 参数,但即使 C 为 1.0 liblinear 也能达到最大迭代次数:

................................................................................
....................
optimization finished, #iter = 1000

WARNING: reaching max number of iterations
Using -s 2 may be faster (also see FAQ)

Objective value = -637.100923
nSV = 783

常见问题解答网站提到了两个可能的原因:

  1. 数据未按比例缩放。
  2. 使用了较大的 C 参数。
  3. 使用了大量具有少量特征的实例,因此求解器L2R_L2LOSS_SVC可能更快。

两者都不适用于我的情况。因为我的特征向量是某种直方图,所以有一个自然最大值,我用它来将特征缩放到 [0,1]。

我将 liblinear 的参数设置如下:

struct parameter svmParams;
svmParams.solver_type = L2R_L2LOSS_SVC_DUAL;
svmParams.eps = 0.1;
svmParams.nr_weight = 0;
svmParams.weight_label = NULL;
svmParams.weight = NULL;
svmParams.p = 0.1;
svmParams.C = 1.0;

我的问题是:FAQ 中未提及的其他哪些原因可能会导致 liblinear 在这种情况下运行缓慢,我该怎么做?

4

0 回答 0