[英]How to correct Numpy and TPOT array shapes error?
我正在嘗試傳遞一個feature
並將numpy數組label
為train_test_split
。 功能是單列(datetime dtype轉換為整數)。 labels
數組中有900個觀察值。
features.shape
返回(1101, 1)
labels.shape
返回(1101, 900)
labels.shape
(1101, 900)
在分成功能和標簽數組之前,我做了df.fillna(0, inplace=True)
因為我原本認為NaN
值是問題。
這是我正在運行的塊:
my_tpot = TPOTRegressor()
X_train, X_test, y_train, y_test = train_test_split(pd.np.array(features), pd.np.array(labels),train_size=0.75, test_size=0.25)
tpot = TPOTRegressor(generations=5, population_size=20, verbosity=2)
tpot.fit(X_train, y_train)
train_test_split
行出現異常。 這是一個例外:
ValueError: Error: Input data is not in a valid format. Please confirm that the input data is scikit-learn compatible. For example, the features must be a 2-D array and target labels must be a 1-D array.
是什么造成的?
事實證明TPOT目前無法解決多標簽回歸問題,這是我的問題傳遞的標簽大小(101, 900)
是行不通的。 如果將其縮減為單列,則代碼可以正常工作。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.