簡體   English   中英

使用邏輯回歸進行預測(Python Sci Kit Learn)

[英]Making predictions with logistic regression (Python Sci Kit Learn)

我使用SciKit學習 Python的邏輯回歸相對較新。 在閱讀了一些主題並觀看了一些演示之后,我決定自己潛水。

所以,基本上,我試圖根據一些功能預測客戶的轉換率。 結果是Active (1)或Not active (0)。 我嘗試過KNN邏輯回歸 使用KNN,我的平均准確度為0.893 ,邏輯回歸為0.994 后者似乎很高,甚至是現實的/可能的?

無論如何:假設我的模型確實非常准確,我現在想要導入一個具有相同特征列的新數據集並預測它們的轉換(它們在本月結束)。 在上面的例子中,我使用cross_val_score來獲得准確度分數。

我現在需要導入新的集合,以某種方式使新集合適合此模型。 (不再訓練,現在我只是想用它)

有人可以告訴我怎么辦? 如果需要其他信息,請對此進行評論。

提前致謝!

除了'Pickle','joblib'也可以使用。

## 
from sklearn.linear_model import LogisticRegression
from sklearn.externals import joblib

假設已經定義了X,Y

model = LogisticRegression()
model.fit(X, Y)

將模型保存到磁盤

filename = 'finalized_model.sav'
joblib.dump(model, filename)

從磁盤加載模型

loaded_model = joblib.load(filename)
result = loaded_model.score(X_test, Y_test)

對於統計問題:當然,它可能發生,要么您的數據噪音很小,要么在評論中提到的方案時鍾奴隸。

對於分類器的導入,你可以pickle它(用pickle模塊將它保存為二進制文件,然后只需在需要時加載它並對新數據使用clf.predict()方法clf.predict()

import pickle 

#Do the classification and name the fitted object clf
with open('clf.pickle', 'wb') as file :
    pickle.dump(clf,file,pickle.HIGHEST_PROTOCOL)

然后你可以加載它

import pickle 

with open('clf.pickle', 'rb') as file :
    clf =pickle.load(file)

# Now predict on the new dataframe df as 
pred = clf.predict(df.values)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM