簡體   English   中英

sklearn錯誤ValueError:輸入包含NaN,無窮大或對於dtype('float32')而言太大的值

[英]sklearn error ValueError: Input contains NaN, infinity or a value too large for dtype('float32')

我不熟悉python,正在嘗試使用SKLEARN庫在python中運行決策樹分類器,並且在運行代碼時遇到錯誤:

ValueError:輸入包含NaN,無窮大或對於dtype('float32')而言太大的值

我嘗試使用較小的excel數據表子集,並且該代碼可以執行所需的結果。 因此,我懷疑問題在於我的數據集太大。 這是導致崩潰的代碼:

df_X = data_train[['DayOfWeek', 'Promo', 'StateHoliday']]
df_Y = data_train[['Sales_band']]

X_train, X_test, y_train, y_test = train_test_split(df_X, df_Y, random_state=1)
model = tree.DecisionTreeClassifier()
model.fit(X_train, y_train) // Line that causes crash
y_predict = model.predict(X_test)

print('The accuracy of the Decision Tree is', accuracy_score(y_test, y_predict))

您的數據集中可能缺少值。 如果不影響預測質量/預測准確性,則可能需要使用dropna()刪除所有包含缺失值的行。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM