[英]Python ValueError: Unknown label type: 'continuous'
我是這里的初學者,我正在為我的一生而努力,以了解這個流程具有與我相同問題的其他堆棧。Logistic回歸:未知標簽類型:“ continuous”
這是我下面的機器學習代碼,並且shell輸出給我ValueError:未知標簽類型:'continuous'
我想我了解我正在“將浮點數傳遞給分類器,該分類器期望將分類值作為目標向量。如果將其轉換為int,則它將被接受為輸入(盡管這樣做是否正確將是有問題的)。最好使用scikit的labelEncoder函數來轉換您的訓練成績”
有人可以給我提示如何將scikit的labelEncoder函數整合到我的代碼中嗎? 這是在說明分類器X和y之前實施的嗎? 無論我在嘗試什么,我都在做錯事。 謝謝
import numpy as np
from sklearn import preprocessing, cross_validation, neighbors, utils
import pandas as pd
df = pd.read_csv('C:\\Users\\bbartling\\Documents\\Python\\WB
Data\\WB_RTU6data.csv', index_col='Date', parse_dates=True)
print(df.head())
print(df.tail())
print(df.shape)
print(df.columns)
print(df.info())
print(df.describe())
X = np.array(df.drop(['VAV6znt'],1))
df.dropna(inplace=True)
y = np.array(df['VAV6znt'])
accuracies = []
X_train, X_test, y_train, y_test =
cross_validation.train_test_split(X,y,test_size=0.50)
clf = neighbors.KNeighborsClassifier(n_neighbors=50)
clf.fit(X_train, y_train)
accuracy = clf.score(X_test, y_test)
print(accuracy)
由於您的VAV6znt
列是浮點型的,這意味着您正在嘗試從數據中估計一個數值。 這使其成為回歸問題,並且您正在使用KNeighborsClassifier
,它是一個分類估計器。
嘗試使用KNeighborsRegressor或名稱中帶有Regressor的任何其他估計量。
像上面所做的那樣將它們轉換為int是可以的,但不會產生良好的結果,因為這意味着您的數據中包含許多類,因為它們是唯一的int,這顯然是錯誤的。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.