簡體 English 中英

訓練零件的邏輯回歸模型以獲取大數據

[英]Train a logistic regression model in parts for big data

原文 2019-02-18 02:36:50 8 1 python/ machine-learning/ nlp/ bigdata/ logistic-regression

預處理后，我的數據集包括160萬行和17000列。 我想對該數據使用邏輯回歸，但是每次加載數據集時，該過程都會被終止。 有沒有一種方法可以訓練塊的邏輯回歸模型，而每次迭代都會更新系數。 sklearn支持我的問題的任何技術嗎？

1 個解決方案

首先，請閱讀此內容。 在數據集上訓練LR的時間有點高。 為了避免這種情況，您可以在sklearn中使用LR的熱啟動參數，並遍歷數據塊。

warm_start：bool，默認值：False設置為True時，請重用上一次調用的解決方案以適合初始化，否則，只需擦除以前的解決方案即可。 對於liblinear求解器無用。 請參閱詞匯表。

（從這里開始）

更准確地說：

warm_start當在同一數據集上反復擬合估算器時，但是對於多個參數值（例如在網格搜索中找到使性能最大化的值），可以重用從先前參數值中學到的模型內容，從而節省時間。 當warm_start為true時， 現有的擬合模型屬性an用於在隨后的fit調用中初始化新模型 。

（從這里開始）

將數據拆分為測試和訓練，在 Pandas 中制作邏輯回歸模型

[英]splitting data into test and train, making a logistic regression model in pandas

Logistic回歸sklearn-訓練和應用模型

[英]Logistic regression sklearn - train and apply model

從頭開始使用正則化 model 訓練邏輯回歸

[英]Train a logistic regression with regularization model from scratch

如何使用單獨的 df 對訓練和測試數據進行邏輯回歸 model 的預測

[英]How to make predictions on a logistic regression model with a separate df for train and test data

在Scikit學習中訓練具有不同特征維度的邏輯回歸模型

[英]train logistic regression model with different feature dimension in scikit learn

如何使用邏輯回歸訓練高度不平衡的數據進行鏈接預測

[英]How to train a highly unbalanced data for link prediction using logistic regression

邏輯回歸模型系數

[英]Logistic regression model coefficient

python，測試集和訓練集中的邏輯回歸

[英]logistic regression in python, Test set and Train set

如何使用新數據重新訓練sklearn中的邏輯回歸模型

[英]How to retrain logistic regression model in sklearn with new data

即使我嘗試使用訓練數據進行預測，sklearn Logistic Regression 的准確性也太低

[英]sklearn Logistic Regression has too little accuracy even if I try to predict with the train data

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 將數據拆分為測試和訓練，在 Pandas 中制作邏輯回歸模型 Logistic回歸sklearn-訓練和應用模型從頭開始使用正則化 model 訓練邏輯回歸如何使用單獨的 df 對訓練和測試數據進行邏輯回歸 model 的預測在Scikit學習中訓練具有不同特征維度的邏輯回歸模型如何使用邏輯回歸訓練高度不平衡的數據進行鏈接預測邏輯回歸模型系數 python，測試集和訓練集中的邏輯回歸如何使用新數據重新訓練sklearn中的邏輯回歸模型即使我嘗試使用訓練數據進行預測，sklearn Logistic Regression 的准確性也太低

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM