繁体   English   中英

LibSVM的准确性降低

[英]Accuracy of LibSVM decreases

得到我的testlabel和trainlabel之后,我在libsvm上实现了SVM,准确率达到97.4359%。 (c = 1且g = 0.00375)

model = svmtrain(TrainLabel, TrainVec, '-c 1 -g 0.00375');
[predict_label, accuracy, dec_values] = svmpredict(TestLabel, TestVec, model);

找到最好的c和g之后,

bestcv = 0;
for log2c = -1:3,
  for log2g = -4:1,
    cmd = ['-v 5 -c ', num2str(2^log2c), ' -g ', num2str(2^log2g)];
    cv = svmtrain(TrainLabel,TrainVec, cmd);
    if (cv >= bestcv),
      bestcv = cv; bestc = 2^log2c; bestg = 2^log2g;
    end
    fprintf('%g %g %g (best c=%g, g=%g, rate=%g)\n', log2c, log2g, cv, bestc, bestg, bestcv);
  end
end

c = 8且g = 0.125

我再次实现该模型:

 model = svmtrain(TrainLabel, TrainVec, '-c 8 -g 0.125');
[predict_label, accuracy, dec_values] = svmpredict(TestLabel, TestVec, model);

我的准确性为82.0513%

精度如何降低? 不应该增加吗? 还是我有任何错误?

由于您预测的是与训练相同的数据,因此在参数调整期间获得的精度会产生偏差。 这通常适合参数调整。

但是,如果您希望这些精度是最终测试集上真实泛化误差的准确估计,则必须添加交叉验证或其他重采样方案的附加包装。

这是一篇非常清晰的论文,概述了一般性问题(但在功能选择的相似上下文中): http : //www.pnas.org/content/99/10/6562.abstract

编辑

我通常会添加交叉验证,例如:

n     = 95 % total number of observations
nfold = 10 % desired number of folds

% Set up CV folds
inds = repmat(1:nfold, 1, mod(nfold, n))
inds = inds(randperm(n))

% Loop over folds
for i = 1:nfold
  datapart = data(inds ~= i, :)

  % do some stuff

  % save results
end

% combine results

要进行交叉验证,您应该拆分训练数据。 在这里,您可以对训练数据进行测试,以找到最佳的参数集。 这不是一个好办法。 您应该使用以下伪代码:

for param = set of parameter to test
  [trainTrain,trainVal] = randomly split (trainSet); %%% you can repeat that several times and take the mean accuracy
  model = svmtrain(trainTrain, param);
  acc = svmpredict(trainVal, model);
  if accuracy is the best
     bestPAram = param
  end
end

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM