'numpy.ndarray' 對象沒有屬性 'columns'

Question

我試圖找出隨機森林分類任務的特征重要性。 但它給了我以下錯誤：

'numpy.ndarray' 對象沒有屬性 'columns'

這是我的代碼的一部分：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline


# importing dataset

dataset=pd.read_csv('Churn_Modelling.csv')
X = dataset.iloc[:,3:12].values
Y = dataset.iloc[:,13].values

#spliting dataset into test set and train set

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size = 0.20)

from sklearn.ensemble import RandomForestRegressor

regressor = RandomForestRegressor(n_estimators=20, random_state=0)  
regressor.fit(X_train, y_train) 

#feature importance

feature_importances = pd.DataFrame(rf.feature_importances_,index = X_train.columns,columns=['importance']).sort_values('importance',ascending=False)

我希望這應該為我的數據集的每一列提供特征重要性分數。 （注：原始數據為CSV格式）

Answer 1

所以X_train從出來train_test_split實際上是一個numpy的陣列，這將永遠不會有一個列。 其次，當你從dataset創建X時，你要求的值是返回numpy.ndarry而不是df。

你需要改變你的路線

feature_importances = pd.DataFrame(rf.feature_importances_,index = X_train.columns,columns=['importance']).sort_values('importance',ascending=False)

至

columns_ = dataset.iloc[:1, 3:12].columns

feature_importances = pd.DataFrame(rf.feature_importances_,index = columns_,columns=['importance']).sort_values('importance',ascending=False)

Answer 2

用這個：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline


# importing dataset

dataset=pd.read_csv('Churn_Modelling.csv')
X = dataset.iloc[:,3:12].values
Y = dataset.iloc[:,13].values

#spliting dataset into test set and train set

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size = 0.20)

from sklearn.ensemble import RandomForestRegressor

regressor = RandomForestRegressor(n_estimators=20, random_state=0)  
regressor.fit(X_train, y_train) 

#feature importance

feature_importances = pd.DataFrame(regressor.feature_importances_,index = dataset.columns,columns=['importance']).sort_values('importance',ascending=False)

Answer 3

iloc 和 loc 函數只能應用於 Pandas 數據幀。 您正在將它們應用於數組。 解決方案：將數組轉換為數據幀，然后應用 iloc 或 loc

'numpy.ndarray' 對象沒有屬性 'columns'

問題描述

3 個解決方案

解決方案1
0 2019-06-21 12:33:49

解決方案2
0 2019-06-21 21:29:31

解決方案3
0 2020-08-07 10:07:14

&#39;numpy.ndarray&#39; 對象沒有屬性 &#39;columns&#39;

問題描述

3 個解決方案

解決方案1 0 2019-06-21 12:33:49

解決方案2 0 2019-06-21 21:29:31

解決方案3 0 2020-08-07 10:07:14

'numpy.ndarray' 對象沒有屬性 'columns'

解決方案1
0 2019-06-21 12:33:49

解決方案2
0 2019-06-21 21:29:31

解決方案3
0 2020-08-07 10:07:14