繁体 English 中英

如何使用新数据更新SVM模型

[英]How to update an SVM model with new data

原文 2016-02-18 21:14:38 0 1 python/ numpy/ machine-learning/ computer-vision/ scikit-learn

我有两个不同大小的数据集。

1）数据集1具有高维度4500个样本（草图）。

2）数据集2具有低维1000个样本（实际数据）。 我想“两个数据集具有相同的分布”

我想在第一个数据集上使用sklearn训练非线性SVM模型（作为预训练），之后我想在第二个数据集的一部分上更新模型（以适应模型）。 如何在sklearn上开发一种更新。 如何更新SVM模型？

1 个解决方案

在sklearn中，您只能为线性内核和使用SGDClassifier执行此SGDClassifier （适当选择损失/惩罚条款，损失应为铰链，惩罚L2）。 通过partial_fit方法支持增量学习，并且SVC和LinearSVC都没有实现。

不幸的是，在实践中，对于这样的小数据集以增量方式拟合SVM是相当无用的。 SVM具有易于获得的全局解决方案 ，因此您不需要预先训练任何形式 ，事实上，如果您正在考虑在神经网络意义上进行预训练，那么它应该无关紧要 。 如果正确实现，SVM应该完全忘记以前的数据集。 为什么不一次学习整个数据呢？ 这就是SVM应该做的事情。 除非您正在使用SVM的一些非凸修改（然后预训练才有意义）。

总结一下：

从理论和实践的角度来看，预训练SVM没有意义。 您既可以只学习第二个数据集，也可以同时学习两者。 预训练仅对于遭受局部最小值（或任何类型的硬收敛）的方法是合理的，因此需要在实际解附近开始以能够找到合理的模型（如神经网络）。 SVM 不是其中之一 。
出于效率原因，您可以使用增量拟合（尽管在sklearn中它非常有限），但是对于这样的小数据集，您可以立即完美地拟合整个数据集。

如何在 sklearn 中为多类 svm model 格式化数据

[英]How to format data for a multiclass svm model in sklearn

tensorflow tf.contrib.learn.SVM如何重新加载训练后的模型并使用预测对新数据进行分类

[英]How tensorflow tf.contrib.learn.SVM reload trained model and use predict to classify new data

在Scikit-Learn（Python 3）中使用新数据重新训练持久性SVM模型

[英]Retraining a Persistent SVM Model with New Data in Scikit-Learn (Python 3)

无法在SVM模型中使用日期时间数据

[英]Unable to use Datetime data in SVM model

大数据上的 SVM 和 NN 模型过拟合

[英]SVM and NN Model overfitting on large data

如何使用添加到旧数据集中的新数据更新先知 model？我尝试了教程，但出现错误

[英]how to update prophet model with new data added to the old data set? I tried the tutorial but I get errors

如何将 SVM 分类器与 keras CNN model 一起使用？

[英]How to use SVM classifier with keras CNN model?

如何将嵌套数组馈送到 SVM model

[英]How to feed a nested array into an SVM model

如何更新 Django 模型数据

[英]How to update Django model data

如何使用新的Image更新Django模型中的ImageField

[英]How to update an ImageField in Django model with a new Image

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在 sklearn 中为多类 svm model 格式化数据 tensorflow tf.contrib.learn.SVM如何重新加载训练后的模型并使用预测对新数据进行分类在Scikit-Learn（Python 3）中使用新数据重新训练持久性SVM模型无法在SVM模型中使用日期时间数据大数据上的 SVM 和 NN 模型过拟合如何使用添加到旧数据集中的新数据更新先知 model？我尝试了教程，但出现错误如何将 SVM 分类器与 keras CNN model 一起使用？如何将嵌套数组馈送到 SVM model 如何更新 Django 模型数据如何使用新的Image更新Django模型中的ImageField

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM