簡體   English   中英

Python ValueError:未知標簽類型:'continuous'

[英]Python ValueError: Unknown label type: 'continuous'

我是這里的初學者,我正在為我的一生而努力,以了解這個流程具有與我相同問題的其他堆棧。Logistic回歸:未知標簽類型:“ continuous”

這是我下面的機器學習代碼,並且shell輸出給我ValueError:未知標簽類型:'continuous'

我想我了解我正在“將浮點數傳遞給分類器,該分類器期望將分類值作為目標向量。如果將其轉換為int,則它將被接受為輸入(盡管這樣做是否正確將是有問題的)。最好使用scikit的labelEncoder函數來轉換您的訓練成績”

有人可以給我提示如何將scikit的labelEncoder函數整合到我的代碼中嗎? 這是在說明分類器X和y之前實施的嗎? 無論我在嘗試什么,我都在做錯事。 謝謝

import numpy as np
from sklearn import preprocessing, cross_validation, neighbors, utils
import pandas as pd

df = pd.read_csv('C:\\Users\\bbartling\\Documents\\Python\\WB             
Data\\WB_RTU6data.csv', index_col='Date', parse_dates=True)

print(df.head())
print(df.tail())
print(df.shape)
print(df.columns)
print(df.info())
print(df.describe())


X = np.array(df.drop(['VAV6znt'],1))
df.dropna(inplace=True)

y = np.array(df['VAV6znt'])


accuracies = []

X_train, X_test, y_train, y_test =             
cross_validation.train_test_split(X,y,test_size=0.50)

clf = neighbors.KNeighborsClassifier(n_neighbors=50)
clf.fit(X_train, y_train)
accuracy = clf.score(X_test, y_test)

print(accuracy)

在此處輸入圖片說明 在此處輸入圖片說明

由於您的VAV6znt列是浮點型的,這意味着您正在嘗試從數據中估計一個數值。 這使其成為回歸問題,並且您正在使用KNeighborsClassifier ,它是一個分類估計器。

嘗試使用KNeighborsRegressor或名稱中帶有Regressor的任何其他估計量。

像上面所做的那樣將它們轉換為int是可以的,但不會產生良好的結果,因為這意味着您的數據中包含許多類,因為它們是唯一的int,這顯然是錯誤的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM