簡體   English   中英

線性回歸訓練/形狀 output 不正確

[英]linear regression train/shape output not correct

我正在嘗試使用線性回歸來預測未來幾年將發布的節目數量。 我有一個數據框,其中每一行都是一個發布,其中包含發布年份、流派等信息......我想用它來預測即將發布的版本數量,所以我所做的是制作一個新的 dataframe在所有唯一年份和 count_values 中獲取當年的發布數量。 所以現在我有 85 行,其中 2 列,1 列是年份,另一列是發布量。

我為此使用 sklearn,這是我迄今為止編寫的代碼。

x = ML_content.drop('releases', axis = 1)
#x = ML_content['years']
y = ML_content['releases']
x_train, y_train, x_test, y_test = train_test_split(x, y, test_size = 20)
x_train.shape, y_train.shape
model = linear_model.LinearRegression()
model.fit(x_train, y_train)

形狀過程的結果是我認為我想要的不正確(這是結果: ((42, 1), (43, 1)) ),因此以下代碼也不起作用。 誰能解釋我做錯了什么或需要發生什么來改變這一點。

感謝您的時間和幫助

根據https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
train_test_split 的返回順序與您的順序不同。
返回順序為:X_train, X_test, y_train, y_test
你得到了:x_train、y_train、x_test、y_test

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM