我正在使用 LIBLINEAR 训练一个简单的逻辑回归分类器。只有3个特征,标签是二进制0-1。
示例输入文件:
1 1:355.55660999775586 2:-3.401379785 3:5
1 1:252.43759050148728 2:-3.96044759307 3:9
1 1:294.15085871437088 2:-13.1649273486 3:14
1 1:432.10492221032933 2:-2.72636786196 3:9
0 1:753.80863694081768 2:-12.4841741178 3:14
1 1:376.54927850355756 2:-6.9494008935 3:7
现在,如果我使用“-s 6”,即“ L1 正则化逻辑回归”,那么 10 倍交叉验证准确率约为 70%,并且每次迭代都在几秒钟内完成。但是如果我使用“-s 7”,也就是“ L2-regularized logistic regression (dual) ”,那么训练迭代次数超过1000,10倍准确率只有60%。
有没有人见过这种奇怪的行为?据我了解,L1 和 L2 之间的唯一区别是正则化项是使用 abs(x) 还是 pow(x, 2)。