簡體   English   中英

邏輯回歸:ValueError:未知標簽類型:“連續”

[英]Logistic regression: ValueError: Unknown label type: 'continuous'

我想使用邏輯回歸來預測和繪制 Excel 數據集中的曲線<\/a>並獲取其斜率系數。 但是,當我運行代碼(見下文)時,會出現錯誤“ValueError: Unknown label type: 'continuous'.”。

我在類似的問題中讀到 y 值應該是 'int' 類型,但我不想轉換它,因為 y 數字介於 1.66 和 0.44 之間......

這種情況有解決方案還是我應該嘗試另一個回歸模型?

非常感謝提前

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import PolynomialFeatures
import seaborn as sns
from sklearn.linear_model import LogisticRegression


df = pd.read_excel('Fatigue2.xlsx',sheet_name='Sheet4')

X = df[['Strain1', 'Temperature1']]
y = df['Cycles1']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=101)

#poly = PolynomialFeatures(degree=2)
#X_ = poly.fit_transform(X_train)

LR = LogisticRegression()
LR.fit(X_train,y_train)

g = sns.lmplot(x='Cycles1', y='Strain1', hue = 'Temperature1', data=df, fit_reg= False)
g.set(xscale='log', yscale ='log')
g.set_axis_labels("Cycles (log N)", "Strain")

print ('Coefficients : ', LR.coef_, 'Intercept :', LR.intercept_)

來自sklearnLogisticRegression是一個分類器,即它期望響應變量是分類的。

你的任務是回歸。 此外,該圖似乎沒有右側 logit 的漸近行為。 使用此處描述的多項式回歸可能會獲得更好的結果。

基於文檔type_of_target(y)

確定目標指示的數據類型。

請注意,此類型是可以推斷的最具體的類型。 例如:

  • binary更具體但與multiclass兼容。
  • multiclass of integers 更具體但與continuous兼容。
  • multilabel-indicator更具體但與multiclass-multioutput兼容。

參數

y : 類數組

退貨

目標類型:字符串

之一:

  • 'continuous': y是一個類似於數組的浮點數,不全是整數,並且是 1d 或列向量。
  • ...

y更改為y.astype(int)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM