繁体   English   中英

训练零件的逻辑回归模型以获取大数据

[英]Train a logistic regression model in parts for big data

预处理后,我的数据集包括160万行和17000列。 我想对该数据使用逻辑回归,但是每次加载数据集时,该过程都会被终止。 有没有一种方法可以训练块的逻辑回归模型,而每次迭代都会更新系数。 sklearn支持我的问题的任何技术吗?

首先,请阅读此内容 在数据集上训练LR的时间有点高。 为了避免这种情况,您可以在sklearn中使用LR的热启动参数,并遍历数据块。

warm_start:bool,默认值:False设置为True时,请重用上一次调用的解决方案以适合初始化,否则,只需擦除以前的解决方案即可。 对于liblinear求解器无用。 请参阅词汇表。

(从这里开始

更准确地说:

warm_start当在同一数据集上反复拟合估算器时,但是对于多个参数值(例如在网格搜索中找到使性能最大化的值),可以重用从先前参数值中学到的模型内容,从而节省时间。 当warm_start为true时, 现有的拟合模型属性an用于在随后的fit调用中初始化新模型

(从这里开始

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM