繁体   English   中英

使用具有不同 random_state 值的 sklearn.linear_model.SGDClassifier 进行逻辑回归时获得完全不同的权重值

[英]Getting completely different weight values when using sklearn.linear_model.SGDClassifier with different random_state value for Logistic Regression

我相信,重量应该随着不同的随机 state 而略有变化。 使用 random_state = None 在每次运行中获得不同权重的原因可能是什么

以下是很少运行的权重值(包含3个功能)1)4.67100318,1.26129186,17.26554955 2)3.39793468,2.10265234,18.424844444353518.41182182186,18255555555555555555555555555555555555555555555555555555555555555555555555555555555555555555555555555555555559999·1949来来说

由于这种波动,我不确定应该使用哪个 random_state,这会在执行特征选择时造成麻烦。 请注意,我在执行标准化后使用数据。

我正在使用如下非常简单的代码来训练我的 model,因为我的数据仅包含 200 行具有 3 个特征的数据

from sklearn.linear_model import SGDClassifier
SGDClf = SGDClassifier(loss='log',random_state=1)
SGDClf.fit(X,Y)

机器学习模型会在同一个数据集上产生不同的结果random_state = None
模型生成一系列称为随机种子的随机数,用于从给定数据集生成测试、验证和训练数据集的过程,例如: random_state = 1
将模型的种子配置为设定值将确保(权重)结果是可重现的。

SGDClassifier() 打乱输入的数据:

传递的(随机状态)值将对 function(拟合、拆分或任何其他 function,如 k_means)返回的结果的再现性产生影响。 -随机 state 文档

希望对您有所帮助

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM