如何修正Numpy和TPOT數組形狀錯誤？

Question

我正在嘗試傳遞一個feature並將numpy數組label為train_test_split 。 功能是單列（datetime dtype轉換為整數）。 labels數組中有900個觀察值。

features.shape返回(1101, 1)

labels.shape返回(1101, 900) labels.shape (1101, 900)

在分成功能和標簽數組之前，我做了df.fillna(0, inplace=True)因為我原本認為NaN值是問題。

這是我正在運行的塊：

my_tpot = TPOTRegressor()
X_train, X_test, y_train, y_test = train_test_split(pd.np.array(features), pd.np.array(labels),train_size=0.75, test_size=0.25)
tpot = TPOTRegressor(generations=5, population_size=20, verbosity=2)
tpot.fit(X_train, y_train)

train_test_split行出現異常。 這是一個例外：

ValueError: Error: Input data is not in a valid format. Please confirm that the input data is scikit-learn compatible. For example, the features must be a 2-D array and target labels must be a 1-D array.

是什么造成的？

Answer 1

事實證明TPOT目前無法解決多標簽回歸問題，這是我的問題傳遞的標簽大小(101, 900)是行不通的。 如果將其縮減為單列，則代碼可以正常工作。

如何修正Numpy和TPOT數組形狀錯誤？

問題描述

1 個解決方案

解決方案1
0 已采納 2019-03-23 19:07:44

如何修正Numpy和TPOT數組形狀錯誤？

問題描述

1 個解決方案

解決方案1 0 已采納 2019-03-23 19:07:44

解決方案1
0 已采納 2019-03-23 19:07:44