預處理機器學習中的錯誤

Question

我正在嘗試對訓練數據進行預處理，並且還嘗試了rehsape函數，但是沒有用，我得到了以下錯誤：

ValueError: Found input variables with inconsistent numbers of samples: [34, 12700]

這是我的代碼：

import pandas as pd
import numpy as np
from sklearn import preprocessing,neighbors
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor

df=pd.read_csv('train.csv')
df.drop(['ID'],1,inplace=True)


X=np.array(df.drop(['label'],1))
y=np.array(df['label'])
print(X.shape)


X = preprocessing.StandardScaler().fit(X)
X=X.mean_


X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2)

clf = RandomForestRegressor(n_estimators=1900,max_features='log2',max_depth=25)
clf.fit(X_train,y_train)

accuracy=clf.score(X_test,y_test)
print(accuracy)

Answer 1

問題在於X = preprocessing.StandardScaler().fit(X) X=X.mean_

此后，您的X將僅包含每列的均值。

要轉換數據，請使用以下代碼：

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

scaler.fit(X)

X = scaler.transform(X)

有關更多詳細信息，請參閱scikit-doc

預處理機器學習中的錯誤

問題描述

1 個解決方案

解決方案1
1 已采納 2018-02-15 07:23:41

預處理機器學習中的錯誤

問題描述

1 個解決方案

解決方案1 1 已采納 2018-02-15 07:23:41

解決方案1
1 已采納 2018-02-15 07:23:41