使用邏輯回歸進行預測（Python Sci Kit Learn）

Question

我使用SciKit學習 Python的邏輯回歸相對較新。 在閱讀了一些主題並觀看了一些演示之后，我決定自己潛水。

所以，基本上，我試圖根據一些功能預測客戶的轉換率。 結果是Active （1）或Not active （0）。 我嘗試過KNN和邏輯回歸 。 使用KNN，我的平均准確度為0.893 ，邏輯回歸為0.994 。 后者似乎很高，甚至是現實的/可能的？

無論如何：假設我的模型確實非常准確，我現在想要導入一個具有相同特征列的新數據集並預測它們的轉換（它們在本月結束）。 在上面的例子中，我使用cross_val_score來獲得准確度分數。

我現在需要導入新的集合，以某種方式使新集合適合此模型。 （不再訓練，現在我只是想用它）

有人可以告訴我怎么辦？ 如果需要其他信息，請對此進行評論。

提前致謝！

Answer 1

除了'Pickle'，'joblib'也可以使用。

## 
from sklearn.linear_model import LogisticRegression
from sklearn.externals import joblib

假設已經定義了X，Y

model = LogisticRegression()
model.fit(X, Y)

將模型保存到磁盤

filename = 'finalized_model.sav'
joblib.dump(model, filename)

從磁盤加載模型

loaded_model = joblib.load(filename)
result = loaded_model.score(X_test, Y_test)

Answer 2

對於統計問題：當然，它可能發生，要么您的數據噪音很小，要么在評論中提到的方案時鍾奴隸。

對於分類器的導入，你可以pickle它（用pickle模塊將它保存為二進制文件，然后只需在需要時加載它並對新數據使用clf.predict()方法clf.predict()

import pickle 

#Do the classification and name the fitted object clf
with open('clf.pickle', 'wb') as file :
    pickle.dump(clf,file,pickle.HIGHEST_PROTOCOL)

然后你可以加載它

import pickle 

with open('clf.pickle', 'rb') as file :
    clf =pickle.load(file)

# Now predict on the new dataframe df as 
pred = clf.predict(df.values)

使用邏輯回歸進行預測（Python Sci Kit Learn）

問題描述

2 個解決方案

解決方案1
2 2017-08-07 08:06:15

解決方案2
1 已采納 2017-08-07 07:37:57

使用邏輯回歸進行預測（Python Sci Kit Learn）

問題描述

2 個解決方案

解決方案1 2 2017-08-07 08:06:15

解決方案2 1 已采納 2017-08-07 07:37:57

解決方案1
2 2017-08-07 08:06:15

解決方案2
1 已采納 2017-08-07 07:37:57