我正在使用libsvm,我必须使用one vs all实现多类的分类。
我该怎么做?2011版使用这个吗
?libsvm
我认为我的问题不是很清楚。如果 libsvm 不自动使用一对多,我将为每个类使用一个 svm,否则我如何在svmtrain
函数中定义这个参数。我已经阅读了 libsvm 的 README。
我正在使用libsvm,我必须使用one vs all实现多类的分类。
我该怎么做?2011版使用这个吗
?libsvm
我认为我的问题不是很清楚。如果 libsvm 不自动使用一对多,我将为每个类使用一个 svm,否则我如何在svmtrain
函数中定义这个参数。我已经阅读了 libsvm 的 README。
根据官方 libsvm文档(第 7 节):
LIBSVM 实现了多类分类的“一对一”方法。如果
k
是类的数量,则k(k-1)/2
构建分类器,每个分类器训练来自两个类的数据。在分类中,我们使用投票策略:每个二元分类都被认为是一次投票,其中可以为所有数据点 x 投票 - 最后将一个点指定为具有最大投票数的类。
在一对多的方法中,我们构建与类一样多的二元分类器,每个分类器都经过训练以将一个类与其他类分开。为了预测一个新实例,我们选择具有最大决策函数值的分类器。
正如我之前提到的,这个想法是训练k
SVM 模型,每个模型将一个类与其他类分开。一旦我们有了这些二元分类器,我们就可以使用概率输出(-b 1
选项)通过选择概率最高的类来预测新实例。
考虑以下示例:
%# Fisher Iris dataset
load fisheriris
[~,~,labels] = unique(species); %# labels: 1/2/3
data = zscore(meas); %# scale features
numInst = size(data,1);
numLabels = max(labels);
%# split training/testing
idx = randperm(numInst);
numTrain = 100; numTest = numInst - numTrain;
trainData = data(idx(1:numTrain),:); testData = data(idx(numTrain+1:end),:);
trainLabel = labels(idx(1:numTrain)); testLabel = labels(idx(numTrain+1:end));
这是我对多类 SVM 的一对一方法的实现:
%# train one-against-all models
model = cell(numLabels,1);
for k=1:numLabels
model{k} = svmtrain(double(trainLabel==k), trainData, '-c 1 -g 0.2 -b 1');
end
%# get probability estimates of test instances using each model
prob = zeros(numTest,numLabels);
for k=1:numLabels
[~,~,p] = svmpredict(double(testLabel==k), testData, model{k}, '-b 1');
prob(:,k) = p(:,model{k}.Label==1); %# probability of class==k
end
%# predict the class with the highest probability
[~,pred] = max(prob,[],2);
acc = sum(pred == testLabel) ./ numel(testLabel) %# accuracy
C = confusionmat(testLabel, pred) %# confusion matrix